绿色排版工具|热门专题|网站地图|移动官网|微信编辑器
您的当前位置:主页 > 电子书 > 计算机类 > 正文

Mahout实战 (Mahout in action) 带目录完整版pdf[13MB]

来源:[db:来源] 编辑:脚本之家 时间:2019-07-29 14:43:36 阅读:

《Mahout实战》是Mahout领域的著作,出自该项目核心成员之手,立足实践,全面介绍了基于Apache Mahout的机器学习技术。《Mahout实战》开篇从Mahout的故事讲起,接着分三部分探讨了推荐系统、聚类和分类,附录涵盖JVM调优、Mahout 数学知识和相关资源。

通过收集数据来学习和演进的计算机系统威力无穷。Mahout作为Apache的开源机器学习项目,把推荐系统、分类和聚类等领域的核心算法浓缩到了可扩展的现成的库中。使用Mahout,你可以立即在自己的项目中应用亚马逊、Netflix及其他互联网公司所采用的机器学习技术。

本书出自Mahout核心成员之手,得到Apache官方推荐,权威性毋庸置疑。作者凭借多年实战经验,为读者展现了丰富的应用案例,并细致地介绍了Mahout的解决之道。本书还重点讨论了可扩展性问题,介绍了如何利用Apache Hadoop框架应对大数据的挑战。

《Mahout实战》适合所有数据分析和数据挖掘人员阅读,需要有Java语言基础。

目录

第1章 初识Mahout  1
1.1  Mahout的故事  1
1.2  Mahout的机器学习主题  2
1.2.1  推荐引擎  2
1.2.2  聚类  3
1.2.3  分类  4
1.3  利用Mahout和Hadoop处理大规模数据  4
1.4  安装Mahout  6
1.4.1  Java和IDE  6
1.4.2  安装Maven  7
1.4.3  安装Mahout  7
1.4.4  安装Hadoop  8
1.5  小结  8
第一部分  推荐
第2章 推荐系统  10
2.1  推荐的定义  10
2.2  运行第一个推荐引擎  11
2.2.1  创建输入  11
2.2.2  创建一个推荐程序  13
2.2.3  分析输出  14
2.3  评估一个推荐程序  14
2.3.1  训练数据与评分  15
2.3.2  运行RecommenderEvaluator  15
2.3.3  评估结果  16
2.4  评估查准率与查全率  17
2.4.1  运行RecommenderIRStats-Evaluator  17
2.4.2  查准率和查全率的问题  19
2.5  评估GroupLens数据集  19
2.5.1  提取推荐程序的输入  19
2.5.2  体验其他推荐程序  20
2.6  小结  20
第3章 推荐数据的表示  21
3.1  偏好数据的表示  21
3.1.1  Preference对象  21
3.1.2  PreferenceArray及其实现  22
3.1.3  改善聚合的性能  23
3.1.4  FastByIDMap和FastIDSet  23
3.2  内存级DataModel  24
3.2.1  GenericDataModel  24
3.2.2  基于文件的数据  25
3.2.3  可刷新组件  25
3.2.4  更新文件  26
3.2.5  基于数据库的数据  26
3.2.6  JDBC和MySQL  27
3.2.7  通过JNDI进行配置  27
3.2.8  利用程序进行配置  28

相关文章推荐:

图文精选:

Copyright©2012-2030小蚂蚁信息网版权所有 站长QQ:1614558876


郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们QQ1614558876删除已转载的信息。

Top