目录
配套资源
第1章人工智能与深度学习概述
视频讲解: 17分钟,3集
1.1人工智能与机器学习
1.1.1人工智能的发展历程
1.1.2机器学习及深度学习的发展历程
1.1.3人工智能与机器学习及深度学习的关系
1.2机器学习的分类
1.2.1监督学习
1.2.2非监督学习
1.2.3半监督学习
1.2.4强化学习
1.3深度学习的分类
1.3.1深度神经网络
1.3.2卷积神经网络
1.3.3其他深度神经网络
1.4深度学习与强化学习的结合
1.4.1强化学习
1.4.2强化学习算法分类
1.4.3深度强化学习
本章小结
第2章机器学习之回归任务
视频讲解: 12分钟,1集
2.1机器学习基础
2.2一元线性回归
2.3解析法实现一元线性回归
2.4解析法实现多元线性回归
2.4.1建立模型
2.4.2编程实现
2.5梯度下降法的基本原理
2.6梯度下降法求解线性回归
2.6.1求解一元线性回归
2.6.2求解多元线性回归
2.7TensorFlow实现梯度下降法
2.7.1TensorFlow的自动求导机制
2.7.2自动求导实现一元线性回归的梯度下降
2.7.3自动求导实现多元线性回归的梯度下降
本章小结
第3章机器学习之分类任务
视频讲解: 14分钟,2集
3.1分类任务与逻辑回归
3.1.1广义线性回归
3.1.2逻辑回归实现二分类
3.1.3交叉熵损失函数
3.1.4TensorFlow实现一元逻辑回归
3.1.5TensorFlow实现多元逻辑回归
3.2模型评估
3.3多分类任务
本章小结
第4章神经网络与深度学习
视频讲解: 11分钟,2集
4.1神经元与感知机
4.2单层神经网络的设计与实现
4.3深度学习
4.3.1多层神经网络
4.3.2机器学习与深度学习对比
4.3.3误差反向传播算法
4.3.4激活函数
4.4实例: 深度学习模型完成分类任务
本章小结
第5章深度神经网络的训练方法
视频讲解: 12分钟,3集
5.1梯度下降算法的优化
5.1.1梯度下降算法的问题
5.1.2基于动量的更新
5.1.3二阶优化方法
5.1.4共轭梯度
5.2自适应学习率算法
5.2.1学习率衰减
5.2.2AdaGrad算法
5.2.3RMSProp算法
5.2.4AdaDelta算法
5.2.5Adam算法
5.2.6几种常见优化算法的比较
5.3参数初始化
5.3.1合理初始化的重要性
5.3.2随机初始化
5.3.3Xavier初始化
5.3.4He初始化
5.3.5批量归一化
5.3.6预训练
5.4Sequential模型搭建和训练神经网络
5.5实例: 深度神经网络实现手写数字识别
本章小结
第6章卷积神经网络
视频讲解: 37分钟,6集
6.1计算机视觉问题
6.1.1图像分类
6.1.2目标定位
6.1.3目标检测
6.1.4图像分割
6.2图像卷积及卷积神经网络
6.2.1图像卷积
6.2.2池化和感受野
6.2.3基本网络结构
6.3实例: 卷积神经网络实现手写数字识别
6.4卷积神经网络的优化方法
6.4.1数据增强
6.4.2随机丢弃
6.4.3级联卷积
6.4.4集成学习
6.5实例: 卷积神经网络识别CIFAR10数据
6.6实例: 基于DeepLabV3+模型的轨道图像分割
本章小结
第7章典型的深度神经网络模型
视频讲解: 38分钟,5集
7.1卷积神经网络的发展
7.2经典网络LeNet
7.2.1LeNet结构
7.2.2实例: 搭建LeNet模型实现数字识别
7.2.3实例: 搭建LeNet模型实现CIFAR10识别
7.3AlexNet模型
7.3.1AlexNet结构
7.3.2实例: 搭建AlexNet模型实现图片分类
7.4VGGNet模型
7.4.1VGGNet结构
7.4.2实例: 搭建VGG16模型
7.5GoogLeNet模型
7.6ResNet模型
7.7循环神经网络
7.7.1RNN结构
7.7.2实例: RNN用于时序数据预测
本章小结
第8章强化学习算法
8.1强化学习综述
8.1.1目标、单步奖励与累积回报
8.1.2马尔可夫决策过程
8.1.3值函数与最优值函数
8.2动态规划方法
8.2.1策略迭代
8.2.2值迭代
8.3基于值函数的强化学习算法
8.3.1基于蒙特卡洛的强化学习算法
8.3.2基于时间差分的强化学习算法
8.3.3TDλ算法
8.4基于策略梯度的强化学习算法
8.4.1何时应用基于策略的学习方法
8.4.2策略梯度详解
8.4.3蒙特卡洛策略梯度算法
8.4.4ActorCritic算法
8.5实例
8.5.1值迭代算法实例
8.5.2SARSA算法实例
8.5.3蒙特卡洛算法实例
8.5.4TDLearning算法实例
8.5.5QLearning算法实例
本章小结
第9章深度强化学习
9.1基于值函数的深度强化学习
9.1.1深度Q学习
9.1.2深度Q学习的衍生方法
9.2基于策略梯度的深度强化学习
9.2.1深度确定性策略梯度算法
9.2.2异步深度强化学习算法
9.3实例
9.3.1DDPG实现pendulumv0实例
9.3.2DDPG实现CartPolev0实例
9.3.3DDPG实现MountainCarv0实例
本章小结
