图书简介
《Python数据分析师修炼之道》是清华大学出版社出版的一本图书。
图书内容
本书详细阐述了与Python数据分析相关的基本解决方案,主要包括Anaconda和Jupyter Notebook、NumPy向量计算、数据分析库pandas、可视化和数据分析、Python统计计算、预测分析模型等内容。此外,本书还提供了相应的示例、代码,以帮助读者进一步理解相关方案的实现过程。 本书既可作为高等院校计算机及相关专业的教材和教学参考书,也可作为相关开发人员的自学教材和参考手册。
作者简介
Python是高级数据分析师和统计人员所用的最常见和最流行的语言之一,可用于处理大型数据集和複杂的数据可视化任务。
本书介绍了Python语言中的核心工具和库,以帮助读者与数据分析处理过程协同工作、準备相关数据以执行简单的统计学分析,进而构建具有实际意义的数据可视化结果。本书将讨论Python语言中的各种库,如NumPy、pandas、matplotlib、seaborn、SciPy和scikit-learn,并将其套用于实际数据分析和统计示例中。在阅读过程中,读者将会领略到如何高效地使用Jupyter Noyebook,并藉助于NumPy和landas库对数据进行操控。此外,还将利用Python库实现简单的预测模型、统计计算-分析和数据分析技术。
目录
第1章 Anaconda和Jupyter Notebook 1
1.1 Anaconda 1
1.2 Jupyter Notebook 3
1.2.1 创建自己的Jupyter Notebook 3
1.2.2 Jupyter Notebook用户界面 4
1.3 使用Jupyter Notebook 5
1.3.1 在代码单元格中运行代码 5
1.3.2 在文本单元格中运行markdown语法 6
1.3.3 键盘快捷操作 9
1.4 本章小结 10
第2章 NumPy向量计算 11
2.1 NumPy简介 11
2.2 NumPy数组 13
2.2.1 在NumPy中创建数组 13
2.2.2 数组的属性 16
2.2.3 数组中的基本数学运算 17
2.2.4 数组的常见操作 19
2.3 使用NumPy进行模拟 23
2.3.1 投掷硬币 23
2.3.2 模拟股票收益 25
2.4 本章小结 27
第3章 数据分析库pandas 29
3.1 pandas库 29
3.1.1 导入pandas中的对象 30
3.1.2 Series 30
3.1.3 创建pandas中的Series 31
3.1.4 DataFrame 34
3.1.5 创建pandas DataFrame 35
3.1.6 剖析DataFrame 36
3.2 pandas操作 37
3.2.1 检查数据 37
3.2.2 数据的选取、添加和删除 37