电子书 Python
Python+Spark2.0+Hadoop机器学习与大数据实战 PDF 高清扫描版免费下载

  • 作者林大贵
  • 格式PDF高清扫描版
  • 大小109MB
  • 发行日期2017-12
  • 出版社清华大学出版社

《Python+Spark2.0+Hadoop机器学习与大数据实战》这本书更适合于大数据与机器学习领域的初学者,或是需要快速掌握技术基础以便进一步深入学习的读者。它通过简化复杂的概念和提供实战演练,成功构建了一个易于进入的学习平台。然而,对于寻求深入理论探讨和高级应用技巧的读者,可能需要配合其他更专业的资源一起学习。

评价

《Python+Spark2.0+Hadoop机器学习与大数据实战》这本书获得了两极分化的评价。一方面,它被称赞为入门大数据与机器学习的理想读物,尤其受到初学者的欢迎。书籍通过浅显的语言和详尽的操作步骤降低了技术门槛,使得即使是初次接触这些复杂技术的读者也能迅速上手,跟随书中的实例学习Spark、Hadoop的配置与基础操作,以及如何在Python环境中应用它们进行机器学习项目。一些读者特别提到,虽然书籍内容可能未深入到高级层面,但其提供的一步步操作指南极为实用,大大减少了学习过程中遇到的技术障碍,增强了学习的信心和效率。

另一方面,也有读者反馈书中的Hadoop和Spark介绍不够深入,部分内容如环境搭建描述显得冗长,可能对有一定基础或寻求深入理解的读者帮助有限。此外,关于配套代码获取的问题也被提及,尽管有热心读者已自行解决并分享至GitHub,但这反映了原书籍在资源提供方面的不便。

目录

  • 第1章 Python Spark机器学习与Hadoop大数据 1
  • 第2章 VirtualBox虚拟机软件的安装 19
  • 第3章 Ubuntu Linux 操作系统的安装 30
  • 第4章 Hadoop Single Node Cluster的安装 57
  • 第5章 Hadoop Multi Node Cluster的安装 80
  • 第6章 Hadoop HDFS命令 117
  • 第7章 Hadoop MapReduce 135
  • 第8章 Python Spark的介绍与安装 148
  • 第9章 在 IPythonNotebook 运行 Python Spark 程序 176
  • 第10章 Python Spark RDD 197
  • 第11章 Python Spark的集成开发环境 229
  • 第12章 Python Spark创建推荐引擎 281
  • 第13章 Python Spark MLlib决策树二元分类 311
  • 第14章 Python Spark MLlib 逻辑回归二元分类 361
  • 第15章 Python Spark MLlib支持向量机SVM二元分类 373
  • 第16章 Python Spark MLlib朴素贝叶斯二元分类 382
  • 第17章 Python Spark MLlib决策树多元分类 391
  • 第18章 Python Spark MLlib决策树回归分析 407
  • 第19章 Python Spark SQL、DataFrame、RDD数据统计与可视化 425
  • 第20章 Spark ML Pipeline 机器学习流程二元分类 462
  • 第21章 Spark ML Pipeline 机器学习流程多元分类 486
  • 第22章 Spark ML Pipeline 机器学习流程回归分析 499

相关书籍

暂无评论

您必须登录才能参与评论!
立即登录
暂无评论...