人工智能所研究的_ Genome Biol:人工智能算法——基因组研究的“瑞士军刀”

每个分子遗传学家都在寻找易于使用的程序,比较来自不同细胞条件的数据集,识别增强子区域,并将其分配给目标基因。

目前,柏林马克思普朗克分子遗传学研究所的马丁·温龙研究小组正在开发掌握这一切的程序。 “DNA在所有细胞中几乎是一样的,所以很无聊。 如果把基因组比作生命之书的话,我对分注更感兴趣”这些“分注”是附着在DNA分子上的小化学标记,遗传信息本身不变,但是会影响相应部位的DNA变化。 也就是说,这些标记具有表观遗传作用。 作为负责启动子和增强子等基因的活化和失活的基因组区域的调节剂发挥作用。

在许多复杂的疾病中,基因的表观遗传调控不能正常发挥作用,这对科学家非常感兴趣。 然而,在实验室对这些地区的分析往往既麻烦又复杂。 所以Vingron和他的团队决定开发新的包装。

此软件包称为条件特定的调整单元预测,它简化了分析并解决了一些实际问题。 开发此软件包的生物信息学Verena Heinrich表示:“我们希望通过简单的共同步骤结合扩展子预测过程的一般步骤”。CRUP在许多方面简化了分析。 机器学习算法不限于特定的细胞或组织类型。 您可以比较多个数据系列,而无需在每次分析数据集时进行重新调整。 该工具由Heinrich和博士Anna Ramisch开发,使用方便。

CRUP确定并表征增强子-刺激或“增强子”基因转录的DNA片段。 这些区域吸引附着在起到各基因开关作用的启动子序列上的蛋白质。 但是,哪个增强子在正确的时间控制正确的基因仍然是个谜。

基因组含有数千个增强子,在细胞生命的各个阶段都有活性。 当DNA像羊毛线一样紧密堆积在被称为组蛋白的载体蛋白的线轴上时,调节排列处于“静止”状态。 这些只影响组蛋白的化学修饰。

这些ChIP数据是新开发计划的初始输入值。 CRUP首先检查所有序列,然后确定它们是否为扩展名。 分类算法基于小鼠胚胎干细胞信息训练的人工智能。 如Heinrich和她的同事在德国遗传学提供的一系列数据所示,可以检测到许多其他动物种类和组织的扩展名区域。

在步骤2中,可以将多个数据集导入到CRUP中,程序可以发现这些差异。 这样,您就可以说明一系列测量结果,也可以查明组织之间的差异。 随着时间的推移,或者将健康与疾病的组织进行比较,可以发现增强子的表观遗传变化。 分析的第三步也是最后一步,将基因映射到各自的增强子。 为了实现这一目标,CRUP将增强子分析与转录数据相结合,转录数据显示哪些基因活跃,实验显示DNA链的哪些部分相邻。

最后,研究人员在实际环境中测试了程序。 他们分析了患有免疫性类风湿性关节炎的小鼠组织,并与健康动物的数据进行了比较。 CRUP确定扩展子区域内的200多个差异,其中的一些差异在其他研究中已经与之相关联。 CRUP分配给这些增强子的基因也表明对疾病有作用。

Vingron说:“我们的程序确定了与疾病相关的候补增强子,并与靶基因相结合。” 他的团队希望这个新工具能够使这个领域变得容易使用,加快研究速度,有助于确定复杂的人类疾病的原因。

资料来源: swisscarmyknifeforgenomeresearch

资料来源: Anna Ramisch、Verena Heinrich、Laura V. Glaser、Alisa Fuchs、Xinyi Yang、Philipp Benner、Robert Schöpflin、Na Li、Sarah Kinkley Anja Römer-Hillmann John Longinotto,Steffen Heyne,Beate Czepukojc,Sonja M. Kessler,Alexandra K. Kiemer,Cristina Cadenas,Laura Arrigoni,Nina Gasparoni,Thomas Thomas Pap,John A. Pospisilik,Jan Hengstler,jrnwalt,sebasaninh.meijsing, ho-ryun chung martinvingron.crup:acomprerehensiveformationttconformationtconformationtconformatio 20 doi:10.1186/s 1300

大家都在看

相关专题