刘毓文(联合培养导师)

    2023-03-08 17:51:34           浏览数:0


个人简介: Yuwen Liu,研究员、博士生导师,中国农业科学院农业基因组研究所动物基因组研究中心副主任。入选国家重大人才工程(青年)、广东省高层次人才(青年)、中国农业科学院“农科英才”领军人才B类、深圳市高层次人才B类,深圳市“青年五四奖章”获得者。2006年于清华大学本科毕业,2014年在芝加哥大学取得博士学位。Yuwen Liu研究员在基因组和表观遗传学领域有着十多年的科学研究经历,在学术研究上擅长开发实验和计算方法,从非编码调控区入手解析经济动物复杂性状的遗传基础,以及基于细胞调控线路设计的合成生物学育种。以第一作者(含并列第一)和通讯作者(含共同通讯)作者在Genome Biology,American Journal of Human Genetics, JACS, Bioinformatics等高水平杂志上共发表文章7篇,以共同作者在 Nature Genetics, Nature Communications 等高水平期刊发表十余篇文章,Google Scholar总引用1000多次。开发了首次直接测量定位全基因组高通量增强子的WHG-STARR-Seq、首次测定了上万GWAS关联性SNP对增强子功能影响的allele-specific STARR-Seq和首次将增强子、DNA变异整合分析拓展到新生突变的统计算法TADA-Annotation。在产业转化上,开发了基于靶向二代测序的伴侣动物基因检测液相芯片,可以通过品系鉴定,遗传病筛查和亲缘关系鉴定提升遗传改良效率,获批三项国家专利,获得产业投资400万元进行产业转化。开发了基于超低覆盖度全基因组测序数据的基因型分型计算方法,领导团队开发了适用于二倍体农业动物和作物的高效低成本基因型分型和基因组选择平台,获得首届广东省种业科技大比武总决赛十强,2021年深圳市创新创业大赛大鹏赛区农业赛道第一名,并以此平台依托基因组所孵化中农芯跃(深圳)生物科技有限公司。引进基因组所后,主持了十四五国家重点研发计划课题、国家自然科学青年科学基金项目、国家自然科学面上项目以及深圳科创委面上项目共4项,核心参与了广东省基础与应用基础研究基金项目、中国农业科学院科技创新工程重大科研计划、十四五重点研发计划等多项项目。

研究方向:转录调控,表观遗传学,基因组学,生物信息学,统计遗传学

学习工作经历:

教育经历:

2006-2014 芝加哥大学获得生物学博士学位(研究方向基因组学)   导师:Kevin White教授

2002-2006 清华大学生物系获学士学位   导师:裴端卿教授

工作经历:

2021-至今 动物基因组研究中心副主任(中国农业科学院农业基因组研究所)

2019-至今 研究员(中国农业科学院农业基因组研究所)

2018-2019 联合创始人兼首席科学家(深圳深知生物科技有限公司)

2015-2018 博士后(芝加哥大学人类遗传系)导师:贺信教授

2016-2018 芝加哥大学生物信息学和计算生物学暑期课程讲师

2014-2015 博士后(基因组和系统生物学研究中心) 导师:Kevin White教授

科学研究:

主要专注于开发新的实验和计算方法,研究转录调控中的增强子定位和功能,非编码区DNA变异如何通过影响增强子功能而影响生物性状,以及如何通过人工设计调控增强子等调控元件改变生物性状,方法具有普遍适用性,同时在解析猪产肉性状遗传机制解析中进行深入应用。具体研究方向包括:

1.结合基因型数据,表型数据和多组学功能注释数据,解析GWAS信号和选择进化信号,从而挖掘影响性状的重要调控元件和基因;

2.开发高通量实验和计算方法,在动物体内和单细胞层面,鉴定影响增强子功能的DNA变异,并以此为切入点,挖掘影响性状的关键基因;

3.开发实验和计算方法,结合高通量调控元件数据进行调控元件序列底层逻辑的解析,优化和设计新一代调控元件和细胞线路,通过合成生物学手段为性状改良提供基因功能模块;

4.开发低成本高密度的新一代基因型检测方法,开发结合多组学数据和深度学习的全基因组选育方法和精细定位方法,协助推进畜牧动物品种选育和性状改良。

研究进展:

1.开发了新一代基因型分型和基因组选择技术体系,极大提高了群体遗传学分析的效率,并降低了分子育种成本。基因分型是基因组选择的先决步骤,目前占其大部分成本。为了降低基因分型的成本,我们开发了一个计算框架,使用超低覆盖率测序数据对猪个体进行基因分型。与目前在猪中使用的方法(Yang et al., 2021)相比,我们的方法能够达到相同水平的基因分型准确度,同时不需要一次处理大量样本。与高覆盖率测序(高于 20X)相比,我们对杜洛克猪的基因分型准确度在 0.5X 测序时高于 98%。为了提高基因组选择的准确性,我们开发了一种基于深度学习的算法,该算法整合了来自多组学数据的信息,包括顺式调控元件、基因表达和基因功能注释,该算法能提升优势个体挑选的准确率,还能反向溯源挖掘功能基因和位点。我们以这两项技术搭建了新一代的智慧育种平台,在第十三届中国深圳创新创业大赛大鹏新区预选赛和第五届大鹏新区创新创业大赛总决赛中获得第一名(http://www.gongyingzixun. com/jggs/3043.html)。我们还在第一届广东种业科技创新大赛(http://dara.gd.gov.cn/nyyw/content/post_3296152.html)的360多个项目中排名前十。相关技术已经孵化中农芯跃(深圳)生物科技有限公司,有稳定的育种服务订单。

2. 通过整合选择信号,转录组,表观组信息解析东西方猪重要经济性状在非编码调控区的遗传机理。通过对234头猪的基因组进行重测序,我们获得了陆川猪(一个具有代表性的东方品种)的高质量参考基因组,其N50为18.03 Mb,并对东方和西方猪的潜在选择区域进行了分析。这些区域的多组织转录组和染色质可及性分析表明,组织特异性选择压可由启动子和远端顺式调控元件介导。我们深入分析了两个案例:1)在小肠中,一个启动子变异可能通过提高启动子活性,提高溶菌酶LYZ的表达,继而增强东方猪的胃肠道免疫和粗粮耐受性;2)在骨骼肌中,一个增强子变异,可能通过提高增强子活性,提高TNNC1基因表达,继而在东方猪增加慢肌纤维的比例,提升肉质。我们的工作初步揭示了非编码变异导致猪表型差异的分子机制,并为基因调控进化在动物驯化和育种中的作用提供了新的视角和宝贵的资源。该研究发表在动物遗传育种顶级期刊Genetics Selection Evolution(中科院1区TOP)上,并获得第十届中国畜牧科技论坛优秀论文奖(每两年一届,每届10篇)。

3.开发了基于混合泊松模型的统计算法为复杂遗传病寻找新的致病基因。该研究致力于通过分析新生突变在自闭症人群中的分布,通过建立统计模型的方式找到和疾病相关的功能性注释(特别是非编码区功能性注释)。继而在新生突变的层面整合这些功能性注释,从而提高搜寻致病基因的解析力。该研究以创新性的统计方法结合了来自于编码区和非编码区的新生突变信息,为复杂疾病全基因组测序的下游分析提供了一个新的分析方法。该研究首次证明了非编码区突变对自闭症发生的重要意义,估算出非编码区突变至少贡献1/3的自闭症风险,为今后的自闭症科学研究和临床诊断指明了方向。同时该文章显著的提高了寻找致病基因的解析力,找到了4个新的致病基因。该文章的方法具有广泛适用性,能够对不同动物不同性状的全基因组测序数据提供新的分析思路。以第一作者发表于American Journal of Human Genetics。

4.开发了以高通量测序(NGS)为基础的大规模筛查转录增强子的方法。在全基因层面确定转录增强子的位置不仅对于研究转录调控极为重要,更可以用来评估非编码区的突变是否影响生物功能。长期以来,人们只能通过诸如ChIP-Seq和DNase-Seq等生化手段,来推测转录增强子在基因组中的位置,但这些手段并不能直接测量转录调控力。我们改良了STARR-Seq技术,第一次在人类基因组中,大规模的筛查了有转录增强子活性的DNA片段。在前列腺癌细胞中,我们发现人类基因组中存在着10万个左右的具有增强子活性的DNA片段,这些片段绝大部分都被异染色质包围着。通过比对RNA-Seq转录组数据,我们推测这些DNA片段的增强子功能被异染色质屏蔽掉。通过HDAC抑制剂诱导实验,我们证实了很多被屏蔽的增强子在异染色质被打开后,其转录调控功能可以得到恢复。该研究首次在人类基因组中进行了全面的增强子筛查,并提出了人类转录调控的两层机制相对独立(染色质层面的调控和基于DNA序列特应性的转录因子调控)。该文章的方法具有广泛适用性,能够对不同动物不同组织的增强子进行全面无偏见的筛选。以第一作者发表于Genome Biology。

5.开发了以高通量测序(NGS)为基础的大规模筛查功能性非编码SNP的方法。GWAS研究发现了数以万计的和复杂疾病性状相关联的SNP位点,但是由于DNA位点之间的连锁性和我们对于非编码区功能的了解所限,从发现的SNP位点找到真正的有因果关系的DNA位点往往并不容易。为了解决这个问题,我们拓展了STARR-Seq技术,使其能够大规模地筛查哪些DNA突变会影响其所在DNA序列的转录调控能力。通过这种方法,我们系统性地筛查了上万个和癌症相关联的SNP,最终发现了70个SNP能够影响所在增强子的转录调控能力。在这70个SNP中,我们深入地研究了其中的两个,更为深入地揭示了他们是如何通过影响转录调控网络来影响癌症风险的。该研究所开发的方法具有广泛的拓展性,适合于在其它物种或者组织中研究上万级别DNA变体的转录调节功能。以第一作者发表于Genome Biology。

6.通过生物信息学分析,为转录组测序(RNA-Seq)实验提供了关于样品重复数量和测序深度选择的技术指南。RNA-Seq对细胞内所有的基因提供了全面的RNA水平测量,为一项广泛使用的生物学技术。为了更好地利用科研资源,合理的选择生物重复数量和测序深度显得尤为重要。一方面,我们追求更为精准地发现两种条件下有哪些基因的表达量发生了差异;另一方面,我们又不想耗费一些没有必要的实验资源。通过生物信息学分析,我们模拟出了不同测序深度和不同生物学重复数量下,RNA-Seq发现差异化表达基因的能力。我们发现总的来说增加生物学重复数量比增加测序深度更有效率。一般情况下,我们建议以3个生物学重复,每个重复测10M的序列来初步实验。 以第一作者发表在Bioinformatics, 被生物统计学专家Jeff Leek 评为2013年基因组学和生物统计学最佳工作之一,截止目前已经被引用超过260次,且被引用学科范围覆盖生物学的各个领域,包括农业和畜牧业。

7.研究了非编码区DNA变体对自闭症的影响。该研究是全球目前为止规模最大的全基因组自闭症测序研究之一 。协助开发了一套研究各种类型突变(包括罕见突变和新生突变中的单碱基突变,插入/缺失突变,结构突变)在自闭症中作用的生物信息学分析系统。以共同作者发表在 Nature Genetics 上。

8.通过对乳腺癌细胞的转录调控组分析寻找新的药物治疗方案。通过分析39个主要转录因子在乳腺癌细胞系MCF-7中的基因组结合位点(ChIP-chip数据)和激活后的转录组变化(转录组芯片),构建了乳腺癌细胞系中的转录调控网络。结合癌症病人的存活年数和基因表达数据,发现了PPARG在乳腺癌发病中的重要作用。以共同作者发表在Cell Reports上。

教学授课情况:

1.实用生物信息技术 专业课 理论课 24学时

2.分子遗传学  专业课  理论课 8学时

获奖及社会兼职等情况:

个人荣誉:

1.2021国家重大人才工程(青年)

2.2021 中国农业科学院“农科英才”领军人才B类

3.2020 广东省重大人才工程(青年)

4.2021 深圳市高层次人才B类

5.2019 中国农业科学院“青年英才”

获奖情况:

1. 2021 深圳市青年五四奖章

2. 2021 首届广东省农业科技创新大比武总决赛十强

3. 2021 深圳市创新创业大赛大鹏赛区一等奖农业食品赛道第一名

4.2022 第二十四届中国国际高新技术成果交易会优秀产品奖

专业团队:

农业农村部畜禽生物组学重点实验室学术委员会委员

中国畜牧兽医学会畜禽遗传标记学分会理事会理事

代表专利:

1.刘毓文,杨承,耿灿. 一种便携式宠物粪便DNA收集器. CN207276618U. 2018-04-28.

2.刘毓文,杨承,耿灿. 基于DNA标记的犬类品系鉴定方法. CN107871060A. 2020-10-09.

3.刘毓文,杨承,耿灿. 一种用于犬系品类鉴定的SNP位点. CN107868830A. 2020-12-11.

4.刘毓文,杨承,耿灿. 犬类多种遗传病筛查的引物组和试剂盒. CN107868820A. 2021-02-12.

5.刘毓文,马文龙,王超,郑伟刚,李奎,唐中林. 基于多组学数据和深度学习的育种方法、装置和设备. CN114743601B. 2023-02-03.

代表论文:

1.Liu Y#*, Fu Y*, Yang Y*, Yi G*, Lian J, Xie B, Yao Y, Chen M, Niu Y, Liu L, Wang L, Zhang Y, Fan X, Tang Y, Yuan P, Zhu M, Li M, Zhang S, Chen Y, Wang B, He J, Lu D, Liachko D, Sullivan ST, Pang B, Chen Y, He X, Li K, Tang Z#. Integration of multi-omics data reveals cis-regulatory variants associated with phenotypic differentiation of eastern from western pigs. Genetics Selection Evolution. 2022 Sept 14. 54:62. doi.org/10.1186/s12711-022-00754-2 (# represents co-corresponding authors, * represents co-first authors)

2.Zhang S, Zhang Y, Chen C, Hu Q, Fu Y, Xu L, Wang C, Liu Y#. Identification of robust and key differentially expressed genes during C2C12 cell myogenesis based on multiomics data. International Journal of Molecular Scicences. 2022,23(11),6002. doi.org/10.3390/ijms23116002.

3.Chen C, Zheng J, Xiong C, Zhou H, Wei C, Hu X, Qian X, He M, Shi Y, Liu Y2,*, Li Z1,*. Metabolomics Characterize the Differential Metabolic Markers between Bama Xiang Pig and Debao Pig to Identify Pork. Foods 2023, 12(1), 5; https://doi.org/10.3390/foods12010005.

4.Yang Y, Yan J, Fan X, Chen J, Wang Z, Liu X, Yi G, Liu Y, Niu Y, Zhang L, Wang L, Li S, Li K, Tang Z. The genome variation and developmental transcriptome maps reveal genetic differentiation of skeletal muscle in pigs. PLoS Genet. 2021 Nov 15;17(11):e1009910. doi: 10.1371/journal.pgen.1009910.

5.Adetula AA, Fan X, Zhang Y, Yao Y, Yan J, Chen M, Tang Y, Liu Y, Yi G, Li K, Tang Z. Landscape of tissue-specific RNA Editome provides insight into co-regulated and altered gene expression in pigs (Sus-scrofa). RNA Biol. 2021 Oct 15;18(sup1):439-450. doi: 10.1080/15476286.2021.1954380. Epub 2021 Jul 27.

6.He B, Liu S, Wang Y, Xu M, Cai W, Liu J, Bai W, Ye S, Ma Y, Hu H, Meng H, Sun T, Li Y, Luo H, Shi M, Du X, Zhao W, Chen S, Yang J, Zhu H, Jie Y, Yang Y, Guo D, Wang Q, Liu Y, Yan H, Wang M, Chen YQ. Rapid isolation and immune profiling of SARS-CoV-2 specific memory B cell in convalescent COVID-19 patients via LIBRA-seq. Signal Transduction and Targeted Therapy. 6, Article number: 195 (2021).

7.Zhang Y, Yao Y, Wang Z, Lu D, Zhang Y, Adetula A, Liu S, Zhu M, Yang Y, Fan X, Chen M, Tang Y, Chen Y, Liu Y, Yi G, Tang Z*. MiR-743a-5p regulates differentiation of myoblast by targeting Mob1b in skeletal muscle development and regeneration. Genes & Diseases, 2020, https://doi.org/10.1016/j.gendis.2020.11.018.

8.Yang Y, Lian J, Xie B, Chen M, Niu Y, Li Q, Liu Y, Yi G, Fan X, Tang Y, Li J, Liachko I, Sullivan S, Nelson B, Zuo E, Tang Z*. Chromosome-scale de novo assembly and phasing of a Chinese indigenous pig genome. bioRxiv Sep. 16, 2019; doi: http://dx.doi.org/10.1101/770958.

9.Hu L*, Liu Y*, Han S*, Yang L*, Cui X, Gao Y, Dai Q, Lu X, Kou X, Zhao Y, Sheng W, Gao S, He X and He C. Jump-seq: genome-wide capture and amplification of 5hmC sites. (* represents co-first authors). Journal of American Chemical Society. 2019 Jun 5;141(22):8694-8697.

10.Ke X, Walker A, Haange S, Lagkouvardos I, Liu Y, Schmitt-Kopplin P, von Bergen M,  Jehmlich N, He X, Clavel T and Cheung P, Synbiotic-driven improvement of metabolic disturbances is associated with changes in the gut microbiome in diet-induced obese mice, Molecular Metabolism, 10.1016/j.molmet.2019.01.012, (2019).

11.Liu Y, Liang Y , Cicek AE, Li J, Muhle R, Knoblauch N, Krenzer M, Mei Y, Wang Y, Jiang Y, Geller E, Li Z, Ionita-Laza I, Wu J, Xia K, Noonan JP, Sun, ZS and He X. A statistical framework of mapping risk genes from de novo mutations in whole-genome sequencing studies. bioRxiv 077578; doi: http://dx.doi.org/10.1101/077578. American Journal of Human Genetics. 102 (6), 1031-1047.

12.Liu Y*, Yu S*, Dhiman VK*, Brunetti T, Eckhart H and White KP. Functional assessment of human enhancer activities using whole genome STARR-seq. (* represents co-first authors). Genome Biology. 2017 18;219.

13.Liu S*, Liu Y*, Wu J, Liang J, Yu S, White KP and Wang X. Systematic identification of regulatory variants associated with cancer. (* represents co-first authors). Genome Biology. 2017 18;194.

14.Liu Y. Nuclear receptor-mediated transcriptional regulation in prostate cancer cells. Thesis at the University of Chicago.

15.Zhao S, Liu J, Nanga P, Liu Y, Cicek E, Knoblauch N, He C, Stephens M and He X. Model-based Analysis of Somatic Mutations Detects Many Potential Driver Genes in Cancer, including the mRNA Methyltransferases METTL3 and METTL14. Nature Communications.

16.Liu Y, Zhou J, and White KP. RNA-seq differential expression studies: more sequence, or more replication. Bioinformatics. 2014 Feb 1; 30(3):301-4.

17.Kittler R, Zhou J, Hua S, Ma L, Liu Y, Pendleton E, Cheng C, Gerstein M, and White KP. A Comprehensive Nuclear Receptor Network for Breast Cancer Cells. Cell Reports. 2013 Feb 21.

18.Werling DM, …, Liu Y, …, Talkowski ME, and Sanders SJ. An analytical framework for whole genome sequence data and its implications for autism spectrum disorder. bioRxiv doi: https://doi.org/10.1101/127043. Nature Genetics. 50, 727-736

19.Wang Y, Liu M, Zhang J, Liu Y, Kopp M, Zhang W and Xiao S. Multidrug resistance protein 1 promotes doxorubicin-induced ovarian toxicity in female mice. Toxicological Sciences. kfy038, https://doi.org/10.1093/toxsci/kfy038.

20.Li J, Pan G, Cui K, Liu Y, Xu S, and Pei D. A dominant-negative form of mouse SOX2 induces trophectoderm differentiation and progressive polyploidy in mouse embryonic stem cells. J Biol Chem. 2007 Jul 6; 282(27):19481-92.

联系方式:邮箱liuyuwen@caas.cn  电话0755-84235947