





定价:99元
印次:1-1
ISBN:9787302693338
出版日期:2025.07.01
印刷日期:2025.07.09
图书责编:孙亚楠
图书分类:学术专著
"《融合多组学数据预测染色质开放性的机器学习方法》以染色质开放性数据的信息解读为主线,通过融合多种组学数据的方式,研究预测染色质开放性的机器学习方法、探索单细胞染色质开放性数据分析的理论与方法;系统性地研究了细胞群与单细胞染色质开放性数据分析中的关键问题,对生物数据解读中的概率密度估计等共性基础问题进行了创新性探索,研究成果不仅能对大规模染色质开放性数据进行高效分析,还能加强对细胞调控机制的深入理解,从而促进对遗传学数据的有效解读。 《融合多组学数据预测染色质开放性的机器学习方法》可供生物信息学、遗传学及染色质开放性数据分析等领域的高校师生和科研院所研究人员及相关技术人员阅读参考。"
刘桥,作者博士毕业于清华大学自动化系,现为美国斯坦福大学博士后研究员。主要研究方向为机器学习与计算生物学。曾获清华大学优秀博士毕业论文,清华大学优秀毕业生,北京市优秀毕业生等荣誉,以第一作者的身份在Nature子刊,美国科学院院刊PNAS,Bioinformatics等**学术刊物发表学术论文多篇。
导师序言 生物大数据的快速发展和积累,特别是在高通量测序技术的推动下,为我们深入理解基因调控机理和探索复杂遗传疾病的发生发展提供了前所未有的机会。然而,目前对这些生物大数据的全面解读仍面临着推理复杂、生物知识不够准确、多源异质数据协同分析不够精细等挑战。近年来,深度学习等人工智能技术在多个领域取得了突破性成果,为解决这些关键问题提供了强大的工具。 刘桥博士在其学位论文中,以染色质开放性这一表观遗传学信号的预测方法为例,系统地研究了细胞群水平及单细胞水平的染色质开放性分析系统与方法,开发了多种机器学习和深度学习方法来进行数据的解读和分析。主要研究内容及创新成果可以概括为以下三点: (1)提出了对染色质开放区域进行预测的深度学习方法。通过整合基因组序列、基因表达数据,以及物种进化保守性信息,获得了很高的预测准确性,解释了染色质开放区域特有的基因组序列特征。进一步基于预测模型设计了个性化的遗传变异致病性识别方法,可促进精准医学中重大疾病的个性化防诊治。 (2)提出了对高维稀疏数据进行概率密度估计的神经网络理论与方法。通过构建两组循环相连的生成对抗网络,在对高维稀疏数据进行降维的同时进行概率密度估计。该理论突破了神经网络研究中理论缺乏的瓶颈,是深度学习理论研究的一项重要进展。 (3)提出了基于单细胞染色质开放性数据辨识细胞类型的神经网络模型。在上述概率密度估计的神经网络理论指导下,设计了用于非监督聚类的循环生成对抗网络模型,实现了对细胞类型的辨识,进行了后续细胞类型层次的功能建模分析。进一步拓展该模型,实现了整合单细胞基因表达与染色质开放性数据的细胞类型精确辨识。 ...
目 录
第 1 章 引言 1
1.1 研究背景与意义 1
1.1.1 高通量测序技术 3
1.1.2 染色质开放性 5
1.1.3 基因调控机制 10
1.2 研究现状与不足 12
1.2.1 细胞群染色质开放性预测方法 12
1.2.2 单细胞染色质开放性分析方法 15
1.3 本书研究内容与贡献 18
1.4 本书内容安排 21
1.5 小结 22
第 2 章 基于序列信息的染色质开放性预测方法 23
2.1 引言 23
2.2 整合序列进化保守性的随机森林预测方法 24
2.2.1 研究背景与动机 24
2.2.2 基于随机森林的 kmerForest 模型 26
2.2.3 kmerForest 模型准确预测染色质开放性 27
2.2.4 利用 kmerForest 模型促进遗传变异数据的解释 31
2.2.5 分析与小结 33
2.3 结合 k 聚体特征的混合卷积神经网络预测方法 34
2.3.1 研究背景与动机 34
2.3.2 基于混合神经网络的 Deopen 模型 36
2.3.3 Deopen 准确预测染色质开放性二值状态 39
2.3.4 Deopen 准确恢复连续染色质开放性信号 44
2.3.5 神经网络卷积核的生物解释 48
2.3.6 分析与小结 50
2.4 小结 54
第 3 章 融合组学数据的跨细胞系染色质开放性预测方法 55
3.1 引言 5... 查看详情