《Python数据科学入门》是一本全面介绍数据科学核心概念与技能的书籍,使用Python语言作为教学工具。该书内容广泛,从基础到进阶,适合多个层次的读者群体。
推荐理由
不同类型文本数据的获取、清洗、组织和可视化如何用NumPy和Pandas模块处理数值数据探索用MySQL和MongoDB配置、填充、查询数据网络创建、度量和分析概率与统计以及机器学习的相关基本概念
内容提要
《Python数据科学入门》以Python 语言讲解数据科学基础知识,涵盖了数据采集、清洗、存储、检索、转换、可视化、高级数据分析(网络分析)、统计和机器学习等内容。具体内容包括:数据科学的Python 核心特性,文本数据、数据库、表格形式的数值数据、series 和frame、网络数据的使用,数据的绘制,概率与统计,机器学习。《Python数据科学入门》面向研究生和本科生、数据科学教员、刚入门的数据科学专业人员,以及那些想拥有一本参考手册来帮助记住所有Python 函数及参数的开发人员。
目录
第1章 什么是数据科学 1
第1单元 数据分析步骤 2
第2 单元 数据获取途径 3
第3 单元 报告的结构 4
轮到你了 5
第2 章 数据科学的Python 核心 6
第4 单元 理解基本的字符串函数 6
第5 单元 选择合适的数据结构 8
第6 单元 通过列表推导式理解列表 9
第7 单元 使用计数器 10
第8 单元 使用文件 11
第9 单元 上网 12
第10 单元 使用正则表达式实现模式匹配 13
第11 单元 globbing 文件名与其他字符串 17
第12 单元 Pickling 和Unpickling 数据 18
轮到你了 18
第3 章 使用文本数据 20
第13 单元 处理HTML 文件 20
第14 单元 处理CSV 文件 24
第15 单元 读取JSON 文件 25
第16 单元 处理自然语言中的文本 27
此处省略N多目录内容...