目 录
第1章 从菜鸟到高手的路径是什么 1
1.1 数据分析基础技能学习 1
1.1.1 Excel能力 2
1.1.2 SQL编程能力 3
1.1.3 Python编程能力 4
1.2 数据分析思维能力培养 6
1.2.1 需求层面:角色转换 7
1.2.2 业务层面:核心指标 9
1.2.3 战略层面:明确方向 9
1.2.4 行业层面:洞察影响 10
1.3 Python数据分析通用链路技能 11
1.3.1 数据收集 11
1.3.2 数据预处理 12
1.3.3 数据分析 12
1.3.4 数据挖掘 13
1.3.5 数据可视化 13
1.3.6 数据分析报告 13
1.4 保持最佳的职业心态 13
1.4.1 遇到问题 14
1.4.2 面对和理解问题 14
1.4.3 解决问题:保持最佳的职业心态 14
1.5 本章小结 16
第2章 NumPy基础 17
2.1 NumPy简介 17
2.2 NumPy结构 17
2.3 数据类型及转换 18
2.4 生成各种数组 19
2.5 数组计算 21
2.6 索引和切片 22
2.7 布尔索引 25
2.8 本章小结 27
第3章 Pandas入门 28
3.1 Series基础使用 29
3.1.1 Series定义和构造 29
3.1.2 Series索引和值 30
3.1.3 字典生成Series 31
3.1.4 Series基础查询与过滤 32
3.1.5 Series和数值相乘 33
3.1.6 Series识别缺失值 33
3.2 DataFrame基础使用 34
3.2.1 DataFrame定义和构造 34
3.2.2 嵌套字典生成DataFrame 36
3.2.3 DataFrame固定行输出 37
3.2.4 DataFrame固定列输出 38
3.2.5 DataFrame列赋值 40
3.2.6 DataFrame列删除 40
3.3 Pandas数据交互 41
3.3.1 重新设置索引 41
3.3.2 删除行和列 42
3.3.3 Pandas选择与过滤 45
3.3.4 Pandas数据对齐和相加 49
3.3.5 Pandas函数apply应用 52
3.3.6 Pandas数据排序 53
3.4 动手实践:Pandas描述性统计 56
3.4.1 列求和 57
3.4.2 最大值和最小值索引位置 57
3.4.3 累计求和输出 58
3.4.4 描述方法describe() 58
3.5 本章小结 59
第4章 Python基础数据处理 60
4.1 数据读取 60
4.2 数据合并 62
4.2.1 按数据库表关联方式 62
4.2.2 按轴方向合并 65
4.3 数据清洗 69
4.3.1 缺失值处理 69
4.3.2 重复值处理 75
4.3.3 特殊处理 76
4.4 数据分组 79
4.5 数据替换 82
4.6 本章小结 84
第5章 SQL基础 85
5.1 MySQL数据库安装 85
5.1.1 MySQL下载与安装 85
5.1.2 数据库管理工具安装 88
5.1.3 数据库的连接 90
5.2 MySQL数据查询 91
5.2.1 基础数据查询 92
5.2.2 模糊数据查询 94
5.2.3 字段处理查询 95
5.2.4 排序 95
5.2.5 函数运算查询 96
5.2.6 分组查询 97
5.2.7 限制查询 97
5.3 多表查询 97
5.4 增、删、改方法 100
5.5 本章小结 101
第6章 Python爬虫基础 103
6.1 爬虫原理和网页构造 103
6.1.1 网络连接 103
6.1.2 爬虫原理 104
6.1.3 网页构造 107
6.2 请求和解析库 108
6.2.1 Requests库 108
6.2.2 Lxml库与Xpath语法 111
6.3 数据库存储 115
6.3.1 新建MySQL数据库 116
6.3.2 Python数据存储 118
6.4 案例实践:爬取当当网图书好评榜TOP500 119
6.4.1 爬取思路 119
6.4.2 爬取代码 122
6.4.3 整体代码和输出 123
6.5 本章小结 126
第7章 数据分析方法 127
7.1 5W2H分析法 127
7.2 漏斗分析法 128
7.3 行业分析法 130
7.4 对比分析法 132
7.5 逻辑树分析法 133
7.6 相关分析法 136
7.7 2A3R分析法 137
7.8 多维拆解分析方法 140
7.9 本章小结 141
第8章 Python可视化 142
8.1 Matplotlib基础 143
8.1.1 可视化:多个子图 144
8.1.2 标题、刻度、标签、图例设置 146
8.1.3 注释 148
8.1.4 图片保存 151
8.2 Matplotlib各种可视化图形 152
8.2.1 折线图 152
8.2.2 柱状图 153
8.2.3 饼图 155
8.2.4 散点图 155
8.3 其他Python可视化工具介绍 156
8.4 可视化案例:动态可视化展示案例 157
8.5 本章小结 159
第9章 Python自动化生成Word分析报告 160
9.1 添加Word文档 161
9.2 添加标题和段落文本 161
9.2.1 添加标题 161
9.2.2 添加段落文本 162
9.3 添加表格 163
9.4 添加图片 165
9.5 设置各种格式 166
9.5.1 添加分页符 166
9.5.2 段落样式 166
9.5.3 字符样式 167
9.6 案例实践:杭州租房市场分析报告自动化 167
9.7 本章小结 170
第10章 行业数据分析思维 171
10.1 电商行业 171
10.1.1 行业经验总结 171
10.1.2 电商案例分析思维 174
10.2 金融信贷行业 176
10.2.1 行业经验总结 176
10.2.2 信贷风控案例分析思维 179
10.3 零售行业 181
10.3.1 行业经验总结 181
10.3.2 零售案例分析思维 185
10.4 本章小结 187
第11章 Python数据挖掘 188
11.1 常用的数据挖掘算法 188
11.1.1 C4.5算法 189
11.1.2 CART算法 189
11.1.3 朴素贝叶斯算法 189
11.1.4 SVM算法 190
11.1.5 KNN算法 190
11.1.6 AdaBoost算法 190
11.1.7 K-Means算法 191
11.1.8 EM算法 191
11.1.9 Apriori算法 191
11.1.10 PageRank算法 192
11.2 数据预处理方法 193
11.2.1 数据导入 194
11.2.2 数据描述 196
11.2.3 数据清洗 199
11.2.4 数据转换 201
11.2.5 数据分割 203
11.2.6 特征缩放 203
11.3 Scikit-learn介绍 204
11.4 模型评估 207
11.5 案例分享 210
11.5.1 数据导入 211
11.5.2 数据现状分析维度 212
11.5.3 缺失值情况 213
11.5.4 异常值情况 213
11.5.5 数据预处理 220
11.5.6 探索性分析 222
11.6 本章小结 233
第12章 ChatGPT数据分析方法实践 234
12.1 应用场景与分析方法建议 235
12.2 产品优化建议 237
12.3 使用ChatGPT编写代码 239
12.3.1 使用ChatGPT编写SQL代码 239
12.3.2 使用ChatGPT编写可视化图表代码 241
12.4 案例分享:使用ChatGPT自动化建模 243
12.4.1 数据上传 243
12.4.2 数据说明 244
12.4.3 数据探索分析 245
12.4.4 数据预处理 246
12.4.5 建模输出预测结果 246
12.4.6 模型评估 247
12.5 本章小结 248
第13章 数据分析师成长过程常见疑问 250
13.1 大厂数据分析岗位的日常工作 250
13.1.1 快速熟悉业务与数据库 250
13.1.2 可视化工具的使用 251
13.1.3 全局思维:搭建业务指标体系 251
13.1.4 产品思维:快速推进 251
13.1.5 不管什么分析方法,能发现解决问题就是好方法 252
13.1.6 项目管理和沟通是一把利剑 252
13.1.7 碎片化时间管理必不可少 252
13.1.8 小结:一个成熟的阿里数据分析师的日常要求 253
13.2 数据分析新人如何写好阶段性工作总结 253
13.2.1 日常工作总结 254
13.2.2 重点项目 255
13.2.3 重点价值 255
13.2.4 重点协同 255
13.2.5 成果呈现 256
13.2.6 小结 256
13.3 做数据分析师会遇到哪些职业困惑 256
13.3.1 数据分析师是否需要具备强大的编程能力 257
13.3.2 数据分析师的价值 257
13.3.3 数据分析师升职加薪是不是很快 258
13.3.4 数据分析师是否容易遇到职业天花板,如何突破 258
13.3.5 如果将来不想再做数据分析师,还可以转向哪些职业 259
13.3.6 小结 259
13.4 转行做数据分析师要做好什么准备 260
13.4.1 了解自己、了解行业、确定方向 260
13.4.2 硬件准备和软件准备 260
13.4.3 小结 263
13.5 数据分析师如何避免中年危机 263
13.5.1 扎实的基本功:分析能力 264
13.5.2 深耕行业:积累独特经验 264
13.5.3 保持热情,不断创新 265
13.5.4 小结 265
13.6 数据分析师的前景 265
13.6.1 一般前景—数据分析师的发展路径 266
13.6.2 潜在前景—数据分析师的内功修炼 266
13.6.3 小结 267
13.7 数据分析师的薪资差异 268
13.7.1 硬件技能差异 268
13.7.2 分析思维的差异 269
13.7.3 沟通能力差异 270
13.7.4 项目管理能力差异 270
13.7.5 小结 271
13.8 数据分析师沦为“取数工具人”,如何破局 271
13.8.1 知己知彼:清楚如何被动沦为工具人 271
13.8.2 提高效率:找到以一当百的终极武器—自助分析工具 272
13.8.3 实现价值:数据驱动业务支持决策,彻底摆脱工具人角色 272
13.8.4 小结 273
13.9 本章小结 273