●第1章 绪论001 1.1 研究目的和意义001 1.2 国内外研究现状005 1.2.1 人体姿态估计005 1.2.2 基于视频的人体动作识别011 1.2.3 基于骨架序列的人体动作识别014 1.2.4 基于互动关系的视觉人体动作识别015 1.2.5 视频群体动作识别027 1.3 研究内容032 1.4 本书结构安排034 第2章 基于时序一致性探索的人体2D姿态估计036 2.1 引言036 2.2 相关工作038 2.2.1 基于深度学习的视频人体2D姿态估计038 2.2.2 卷积长短时记忆网络和可变形卷积038 2.3 问题定义039 2.4 图像人体2D姿态估计网络040 2.5 视频时序一致性探索041 2.5.1 变形操作042 2.5.2 聚合操作043 2.5.3 双向时序一致性探索043 2.5.4 多尺度时序一致性探索044 2.6 视频人体2D姿态估计网络044 2.7 实验结果046 2.7.1 实验设置046 2.7.2 性能比较048 2.7.3 模型控制变量分析与实验结果051 2.8 本章小结055 第3章 多视角几何驱动的自监督人体3D姿态估计057 3.1 引言057 3.2 相关工作059 3.2.1 基于深度学习的单目人体3D姿态估计060 3.2.2 弱/自监督单目人体3D姿态估计060 3.3 自监督人体3D姿态估计方法061 3.3.1 双分支自监督训练网络结构061 3.3.2 损失函数062 3.3.3 训练064 3.4 实验结果065 3.4.1 实验设置065 3.4.2 模型控制变量分析与实验结果066 3.4.3 性能比较070 3.5 本章小结071 第4章 基于人体形状与相机视角一致分解的人体3D姿态估计072 4.1 引言072 4.2 相关工作074 4.2.1 基于字典学习的单目人体3D姿态估计方法074 4.2.2 运动恢复非刚体结构075 4.3 问题定义075 4.4 一致分解网络076 4.5 层次化字典学习077 4.6 模型训练079 4.7 实验结果079 4.7.1 实验设置079 4.7.2 模型控制变量分析与实验结果080 4.7.3 性能比较083 4.8 本章小结084 第5章 基于多时空特征的人体动作识别086 5.1 引言086 5.2 相关工作088 5.2.1 基于表观的时空表示学习088 5.2.2 基于骨架序列的时空表示学习089 5.3 多时空特征人体动作识别方法概述089 5.4 多层级表观特征聚合090 5.4.1 局部演化描述符提取090 5.4.2 局部演化描述符编码092 5.4.3 深度监督的多层级特征聚合092 5.5 时空图卷积网络093 5.5.1 时空图卷积094 5.5.2 网络细节095 5.6 实验结果096 5.6.1 实验设置096 5.6.2 模型控制变量分析与实验结果097 5.6.3 性能比较099 5.7 本章小结100 第6章 基于扁平式互动关系分析的多人动作识别101 6.1 引言101 6.2 相关工作109 6.3 特征表征111 6.3.1 肢体角度描述符特征113 6.3.2 空间布局特征114 6.3.3 基于融合受限玻尔兹曼机的特征融合116 6.4 线索互动关系模型126 6.5 扁平式动作识别方法127 6.6 局部线索与局部识别129 6.7 基于目标子空间度量的动作相关性分析130 6.8 全局线索整合与动作识别131 6.8.1 全局-局部线索整合算法131 6.8.2 改进全局-局部线索整合算法132 6.9 实验结果与分析136 6.9.1 数据集及实验设置136 6.9.2 算法结果与分析138 6.9.3 与现有方法的对比146 6.10 本章小结149 第7章 基于层级式互动关系分析的群组动作识别150 7.1 引言150 7.2 相关工作152 7.3 混合群组动作模型154 ● ● 7.4 混合群组动作模型的概率分布157 ● ● ……