绿色排版工具|热门专题|网站地图|移动官网|微信编辑器
您的当前位置:主页 > 电子书 > 计算机类 > 正文

spark graphX实战 ([美]Michael S. Malak) 英文+中文完整pdf版[104MB]

来源:[db:来源] 编辑:脚本之家 时间:2019-07-29 14:45:28 阅读:

Spark GraphX实战》是一本Spark GraphX入门书籍。前5章为基础内容,即使读者对Spark、GraphX、Scala不熟悉,也能快速上手;后5章为图计算进阶,主要是图算法和机器学习算法的相关内容。专门讲图计算的书很少,《Spark GraphX实战》在第2、3、4章介绍了图的基础知识、GraphX基础知识、GraphX内置的图算法。第6章到第10章,主要介绍了GraphX之外的图算法、机器学习、图工具、GraphX监控和优化、GraphX的能力增强等实用技能。第9章和第10章主要介绍性能调优和监控,主要面向生产环境,有不少可以借鉴的技巧。

《Spark GraphX实战》面向对图计算感兴趣的读者,旨在帮助读者掌握Spark GraphX的相关知识及其应用。

目录
 

序言 XI
致谢XIII
关于本书 XIV
关于封面插图 XVIII
第1部分 Spark和图
1 两项重要的技术:Spark和图 3
1.1 Spark:超越Hadoop MapReduce 4
1.1.1 模糊的大数据定义 6
1.1.2 Hadoop:Spark之前的世界 6
1.1.3 Spark:内存中的 MapReduce处理 7
1.2 图:挖掘关系中的含义 9
1.2.1 图的应用 11
1.2.2 图数据的类型 12
1.2.3 普通的关系型数据库在图方面的不足 14
1.3 把快如闪电的图处理放到一起:Spark GraphX 14
1.3.1 图的属性:增加丰富性 15
1.3.2 图的分区:当图变为大数据集时 17
1.3.3 GraphX允许选择:图并行还是数据并行 19
1.3.4 GraphX支持的各种数据处理方式 19
1.3.5 GraphX与其他图系统 21
1.3.6 图存储:分布式文件存储与图数据库 23
1.4 小结 23
2 GraphX快速入门 24
2.1 准备开始并准备数据 24
2.2 用Spark Shell做GraphX交互式查询 26
2.3 PageRank算法示例 29
2.4 小结 31
3 基础知识 32
3.1 Scala—Spark的原生编程语言 33
3.1.1 Scala的理念:简洁和表现力 33
3.1.2 函数式编程 34
3.1.3 类型推断 38
3.1.4 类的声明 39
3.1.5 map和 reduce 41
3.1.6 一切皆是“函数” 42
3.1.7 与 Java的互操作性 44
3.2 Spark 44
3.2.1 分布式内存数据: RDD 44
3.2.2 延迟求值 47
3.2.3 集群要求和术语解释 49
3.2.4 序列化 50
3.2.5 常用的 RDD操作 50
3.2.6 Spark和 SBT初步 54
3.3 图术语解释 55
3.3.1 基础 55
3.3.2 RDF图和属性图 58
3.3.3 邻接矩阵 59
3.3.4 图查询系统 59
3.4 小结 60
第2部分 连接顶点
4 GraphX 基础 65
4.1 顶点对象与边对象 65
4.2 mapping操作 71
4.2.1 简单的图转换 71
4.2.2 Map/Reduce 73
4.2.3 迭代的 Map/Reduce 77
4.3 序列化/反序列化 79
4.3.1 读 /写二进制格式的数据 79
4.3.2 JSON格式 81

图文精选:

Copyright©2012-2030小蚂蚁信息网版权所有 站长QQ:1614558876


郑重声明:本网站资源、信息来源于网络,完全免费共享,仅供学习和研究使用,版权和著作权归原作者所有,如有不愿意被转载的情况,请通知我们QQ1614558876删除已转载的信息。

Top