图书介绍

Scala机器学习【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

Scala机器学习
  • (美)亚历克斯·科兹洛夫(AlexKozlov)著 著
  • 出版社: 北京:机械工业出版社
  • ISBN:9787111572152
  • 出版时间:2017
  • 标注页数:204页
  • 文件大小:23MB
  • 文件页数:219页
  • 主题词:JAVA语言-程序设计

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

Scala机器学习PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

第1章 探索数据分析1

1.1 Scala入门2

1.2去除分类字段的重复值2

1.3数值字段概述4

1.4基本抽样、分层抽样和一致抽样5

1.5使用Scala和Spark的Note-book工作8

1.6相关性的基础12

1.7总结14

第2章 数据管道和建模15

2.1影响图16

2.2序贯试验和风险处理17

2.3探索与利用问题21

2.4不知之不知23

2.5数据驱动系统的基本组件23

2.5.1数据收集24

2.5.2数据转换层25

2.5.3数据分析与机器学习26

2.5.4 UI组件26

2.5.5动作引擎28

2.5.6关联引擎28

2.5.7监控28

2.6优化和交互28

2.7总结29

第3章 使用Spark和MLIib30

3.1安装Spark31

3.2理解Spark的架构32

3.2.1任务调度32

3.2.2 Spark的组件35

3.2.3 MQTT、ZeroMQ、Flume和Kafka36

3.2.4 HDFS、Cassandra、S3和Tachyon37

3.2.5 Mesos、YARN和Standa-lone38

3.3应用38

3.3.1单词计数38

3.3.2基于流的单词计数41

3.3.3 Spark SQL和数据框45

3.4机器学习库46

3.4.1 SparkR47

3.4.2图算法:Graphx和Graph-Frames48

3.5 Spark的性能调整48

3.6运行Hadoop的HDFS49

3.7总结54

第4章 监督学习和无监督学习55

4.1记录和监督学习55

4.1.1 Iirs数据集56

4.1.2类标签点57

4.1.3 SVMWithSGD58

4.1.4 logistic回归60

4.1.5决策树62

4.1.6 bagging和boosting:集成学习方法66

4.2无监督学习66

4.3数据维度71

4.4总结73

第5章 回归和分类74

5.1回归是什么74

5.2连续空间和度量75

5.3线性回归77

5.4 logistic回归81

5.5正则化83

5.6多元回归84

5.7异方差84

5.8回归树85

5.9分类的度量87

5.10多分类问题87

5.11感知机87

5.12泛化误差和过拟合90

5.13总结90

第6章 使用非结构化数据91

6.1嵌套数据92

6.2其他序列化格式100

6.3 Hive和Impala102

6.4会话化104

6.5使用特质109

6.6使用模式匹配110

6.7非结构化数据的其他用途113

6.8概率结构113

6.9投影113

6.10总结113

第7章 使用图算法115

7.1图简介115

7.2 SBT116

7.3 Scala的图项目119

7.3.1增加节点和边121

7.3.2图约束123

7.3.3 JSON124

7.4 GraphX126

7.4.1谁收到电子邮件130

7.4.2连通分量131

7.4.3三角形计数132

7.4.4强连通分量132

7.4.5 PageRank133

7.4.6 SVD++134

7.5总结138

第8章 Scala与R和Python的集成139

8.1 R的集成140

8.1.1 R和SparkR的相关配置140

8.1.2数据框144

8.1.3线性模型150

8.1.4广义线性模型152

8.1.5在SparkR中读取JSON文件156

8.1.6在SparkR中写入Parquet文件157

8.1.7从R调用Scala158

8.2 Python的集成161

8.2.1安装Python161

8.2.2 PySpark162

8.2.3从Java/Scala调用Python163

8.3总结167

第9章 Scala中的NLP169

9.1文本分析流程170

9.2 Spark的MLlib库177

9.2.1 TF-IDF177

9.2.2 LDA178

9.3分词、标注和分块185

9.4 POS标记186

9.5使用word2vec寻找词关系189

9.6总结192

第10章 高级模型监控193

10.1系统监控194

10.2进程监控195

10.3模型监控201

10.3.1随时间变化的性能202

10.3.2模型停用标准202

10.3.3 A/B测试202

10.4总结202

热门推荐