图书介绍

大数据分析概论【2025|PDF下载-Epub版本|mobi电子书|kindle百度云盘下载】

大数据分析概论
  • 朱晓峰主编 著
  • 出版社: 南京:南京大学出版社
  • ISBN:9787305199530
  • 出版时间:2018
  • 标注页数:387页
  • 文件大小:57MB
  • 文件页数:401页
  • 主题词:数据处理-高等学校-教材

PDF下载


点此进入-本书在线PDF格式电子书下载【推荐-云解压-方便快捷】直接下载PDF格式图书。移动端-PC端通用
种子下载[BT下载速度快]温馨提示:(请使用BT下载软件FDM进行下载)软件下载地址页直链下载[便捷但速度慢]  [在线试读本书]   [在线获取解压码]

下载说明

大数据分析概论PDF格式电子书版下载

下载的文件为RAR压缩包。需要使用解压软件进行解压得到PDF格式图书。

建议使用BT下载工具Free Download Manager进行下载,简称FDM(免费,没有广告,支持多平台)。本站资源全部打包为BT种子。所以需要使用专业的BT下载软件进行下载。如BitComet qBittorrent uTorrent等BT下载工具。迅雷目前由于本站不是热门资源。不推荐使用!后期资源热门了。安装了迅雷也可以迅雷进行下载!

(文件页数 要大于 标注页数,上中下等多册电子书除外)

注意:本站所有压缩包均有解压码: 点击下载压缩包解压工具

图书目录

理论篇3

第一章 大数据分析概述3

1.1大数据分析的背景与基础4

1.1.1大数据分析的背景4

1.1.2大数据分析的基础6

1.2大数据分析的概念与原理8

1.2.1大数据分析的概念界定8

1.2.2大数据分析的基本原理10

1.3大数据分析的思维与误区11

1.3.1大数据分析的思维11

1.3.2大数据分析的误区14

1.4大数据分析的作用及影响19

1.4.1大数据分析对企业的作用和影响19

1.4.2大数据分析对社会的作用和影响20

1.5大数据分析的过程与对象21

1.5.1大数据分析的过程21

1.5.2大数据分析的对象22

1.6大数据分析的流程与基础模型25

1.6.1大数据分析的流程25

1.6.2大数据分析的基础模型27

延伸阅读思考:大数据分析带来的改变29

实验一:认知大数据分析的价值29

第二章 大数据分析的体系架构30

2.1大数据分析的总体架构31

2.1.1基础IT系统31

2.1.2数据集中与标准化32

2.1.3数据报表与可视化33

2.1.4产品与运营分析34

2.1.5精细化运营35

2.1.6数据产品36

2.2大数据分析的技术体系36

2.2.1基于分析流程的大数据技术栈36

2.2.2基于主流软件的大数据技术栈37

2.2.3基于淘宝海量数据的大数据技术栈39

2.3大数据分析的产业架构40

2.3.1国外大数据分析的产业架构40

2.3.2国内大数据分析的产业架构43

延伸阅读思考:携程大数据应用框架的重构48

实验二:理解大数据分析的体系49

第三章 大数据分析的关键技术50

3.1大数据分析的关键技术概述51

3.1.1基于大数据分析流程的关键技术51

3.1.2基于大数据生态的关键技术53

3.1.3大数据分析技术的发展趋势55

3.2大数据分析的基础架构Hadoop56

3.2.1 Hadoop概述56

3.2.2 Hadoop的版本与选择58

3.2.3 Hadoop生态的四层架构59

3.2.4 Hadoop生态中的典型组件61

3.2.5 Spark65

3.3大数据分析的云技术68

3.3.1云计算68

3.3.2云平台71

3.4大数据分析的存储技术72

3.4.1分布式文件系统72

3.4.2分布式数据库HBase73

3.4.3 NoSQL数据库74

延伸阅读思考:“大数据+人脸识别”助力众可贷77

实验三:认知大数据分析工具——以“魔镜”为例79

第四章 大数据分析的数据采集与存储84

4.1大数据采集概述85

4.1.1大数据采集的基本概念85

4.1.2大数据采集的数据源86

4.1.3大数据采集架构与场景87

4.1.4大数据采集的困境及对策88

4.2大数据采集工具90

4.2.1已有大数据采集工具的比较90

4.2.2大数据采集工具的设计92

4.3大数据存储96

4.3.1传统存储面临的挑战96

4.3.2大数据存储概述98

4.3.3大数据存储的技术路线103

4.3.4大数据存储和管理数据库系统104

延伸阅读思考:医疗大数据——数据收集或是最难点108

实验四:大数据分析的数据导入与编辑109

第五章 大数据分析的数据清洗117

5.1大数据质量118

5.1.1大数据质量概述118

5.1.2大数据质量产生的根源121

5.1.3大数据质量问题的分类与实例125

5.2大数据清洗概述127

5.2.1大数据清洗定义127

5.2.2大数据清洗的对象127

5.2.3大数据清洗的总体架构129

5.2.4大数据清洗与数据质量的关系130

5.3大数据清洗的方法与工具131

5.3.1大数据清洗方法概述131

5.3.2可视化大数据清洗132

5.3.3大数据清洗的工具135

5.4大数据清洗的过程与具体内容139

5.4.1大数据清洗的过程139

5.4.2大数据清洗的具体内容142

延伸阅读思考:微软与谷歌的拼写检查146

实验五:大数据分析的数据清洗147

第六章 大数据分析的数据挖掘156

6.1传统数据挖掘157

6.1.1数据挖掘的界定157

6.1.2数据挖掘的基本流程160

6.1.3数据挖掘面临的主要问题164

6.2大数据和数据挖掘165

6.2.1递进升级学说165

6.2.2一体两面学说167

6.2.3互相促进学说168

6.2.4其他学说169

6.3大数据挖掘的任务170

6.3.1分类170

6.3.2聚类172

6.3.3关联分析173

6.3.4估测和预测174

6.4大数据挖掘的流程175

6.5大数据挖掘的常用算法177

6.5.1决策树177

6.5.2遗传算法183

6.5.3神经网络186

6.5.4关联规则189

6.5.5粗糙集191

延伸阅读思考:大数据预测——真的有那么神奇吗?193

实验六:大数据挖掘实验194

第七章 大数据分析的数据展现197

7.1数据可视化概述198

7.1.1数据可视化的含义198

7.1.2数据可视化的应用价值和应用领域200

7.1.3数据可视化的工具201

7.1.4数据可视化步骤205

7.2数据可视化的基础要素208

7.2.1数据208

7.2.2图表209

7.3数据可视化的表现形式214

7.3.1数据可视化的常见方式214

7.3.2不同类型数据的展示215

7.3.3不同类型图形的展示217

7.4数据可视化的设计220

7.4.1设计的基本理念220

7.4.2图表设计技巧222

7.4.3配色方案设计224

7.4.4字体设计227

7.4.5应用场景设计228

7.5数据可视化的改进231

7.5.1总体思路231

7.5.2图表改进思路233

延伸阅读思考:《卫报》的数据可视化与数据新闻235

实验七:数据图表规范化和美化238

实训篇247

第一章 财务数据分析247

1.1实训背景知识247

1.2实训简介247

1.2.1原始数据情况247

1.2.2实训分析过程248

1.3实训过程248

1.3.1新建项目248

1.3.2数据导入249

1.3.3数据处理249

1.3.4数据分析251

1.3.5数据可视化255

1.4实训总结259

1.5实训思考题260

第二章 库龄库存分析261

2.1实训背景知识261

2.2实训简介261

2.2.1原始数据情况261

2.2.2实训分析过程261

2.3实训过程262

2.3.1新建项目262

2.3.2数据导入262

2.3.3数据处理263

2.3.4数据分析263

2.3.5数据可视化267

2.4实训总结268

2.5实训思考题268

第三章 销售数据分析269

3.1实训背景知识269

3.2实训简介269

3.2.1原始数据情况269

3.2.2实训分析过程270

3.3实训过程270

3.3.1新建项目270

3.3.2数据导入271

3.3.3数据处理271

3.3.4数据分析272

3.3.5数据挖掘279

3.3.6数据可视化280

3.4实训总结281

3.4.1实训总结结论281

3.4.2实训总结建议282

3.5实训思考题282

第四章 油井数据分析283

4.1实训背景知识283

4.2实训简介283

4.2.1原始数据情况283

4.2.2实训分析过程284

4.3实训过程284

4.3.1新建项目284

4.3.2数据导入285

4.3.3数据处理285

4.3.4数据分析288

4.3.5数据挖掘291

4.3.6数据可视化292

4.4实训总结294

4.5实训思考题294

第五章 网站流量分析295

5.1实训背景知识295

5.2实训简介296

5.2.1原始数据情况296

5.2.2实训分析过程296

5.3实训过程297

5.3.1新建项目297

5.3.2数据导入297

5.3.3数据处理298

5.3.4数据分析298

5.3.5数据挖掘304

5.4实训总结306

5.5实训思考题306

第六章 楼盘数据分析307

6.1实训背景知识307

6.2实训简介307

6.2.1原始数据情况307

6.2.2实训分析过程308

6.3实训过程308

6.3.1新建项目308

6.3.2数据导入309

6.3.3数据处理309

6.3.4数据分析310

6.3.5数据可视化313

6.4实训总结314

6.5实训思考题314

第七章 贷款数据分析315

7.1实训背景知识315

7.2实训简介315

7.2.1原始数据情况315

7.2.2实训分析过程316

7.3实训过程316

7.3.1新建项目316

7.3.2数据导入317

7.3.3数据处理317

7.3.4数据分析318

7.3.5数据可视化324

7.4实训总结325

7.5实训思考题325

第八章NBA数据分析326

8.1实训背景知识326

8.2实训简介326

8.2.1原始数据情况326

8.2.2实训分析过程326

8.3实训过程327

8.3.1新建项目327

8.3.2数据导入327

8.3.3数据处理328

8.3.4数据分析329

8.3.5数据可视化333

8.4实训总结336

8.5实训思考题336

第九章 行业职位需求分析337

9.1实训背景知识337

9.2实训简介337

9.2.1原始数据情况337

9.2.2实训分析过程338

9.3实训过程338

9.3.1新建项目338

9.3.2数据导入339

9.3.3数据处理339

9.3.4数据分析341

9.3.5数据可视化348

9.4实训总结349

9.5实训思考题350

第十章 水资源数据分析351

10.1实训背景知识351

10.2实训简介351

10.2.1原始数据情况351

10.2.2实训分析过程352

10.3实训过程352

10.3.1新建项目352

10.3.2数据导入353

10.3.3数据处理353

10.3.4数据分析354

10.3.5数据可视化360

10.4实训总结362

10.5实训思考题362

第十一章 国民经济数据分析363

11.1实训背景知识363

11.2实训简介363

11.2.1原始数据情况363

11.2.2实训分析过程364

11.3实训过程364

11.3.1新建项目364

11.3.2数据导入365

11.3.3数据处理365

11.3.4数据分析367

11.3.5数据可视化373

11.4实训总结374

11.5实训思考题374

第十二章 政府财政预算分析375

12.1实训背景知识375

12.2实训简介375

12.2.1原始数据情况376

12.2.2实训分析过程376

12.3实训过程376

12.3.1新建项目376

12.3.2数据导入377

12.3.3数据处理377

12.3.4数据分析378

12.3.5数据可视化383

12.3.6数据分析结果的分享386

12.4实训总结386

12.5实训思考题386

热门推荐