今天是2024年11月25日 星期一
2018年8月13日

科学家将统计学和生物学合并为一个重要的

新基因计算工具

我们体内的细胞以不同的方式表达自己。一个细胞可能会让一大块遗传密码工作,而另一个细胞完全忽略相同的信息。了解为什么可以刺激新的干细胞疗法,或导致对生物体如何发展的更基本的理解。把这些细胞之间的差异归咎于可能是具有挑战性的。

现在,两位加州大学洛杉矶分校的研究人员提出了一种计算工具,可以提高测量单个细胞中基因表达强度的可靠性,即使细胞几乎不读取某些基因。该研究上个月在Nature Communications杂志上发表。

“该研究的通讯作者和加州大学洛杉矶分校统计助理教授晶怡说:”DNA序列在脑细胞,肝细胞和心脏细胞中是一样的。“为什么这些细胞看起来如此不同?关键是基因表达。”

DNA编码创建和操作生物体所需的信息。但是阅读和处理这些信息的任务就是RNA,它是将基因指令运送到细胞其他部分的长链移动分子。通过计算细胞中的各种RNA分子,研究人员可以确定哪些基因具有活性或“表达”以及程度如何。

但是,如果RNA分子仅以微量存在,分析工具可能被愚弄,认为相应的基因根本没有活性。除非纠正,否则这些“辍学”可能会画出关于细胞之间实际差异的误导性图片。

“如果你想在个体细胞水平获得有用的生物信息,那么你需要做一些统计推断,”李先生说,他也是统计和生物学实验室交汇处的负责人。“否则你的结论可能是错误的。”

加利福尼亚大学洛杉矶分校统计系的博士研究生LiWeiVivianLi设计了统计分析软件来处理RNA测序中的辍学情况。他们的工具叫做“scImpute”,根据在实验中研究所有单个细胞,估计细胞中的哪些基因最有可能退出。然后该工具使用来自相似细胞的信息对基因表达水平应该是什么进行有教育的猜测。

利用估计并不新鲜,但可用的工具要么过于宽泛用另一种细胞的所有基因表达互换或者针对特定类型的研究超特定的。 Jessica Li说,scImpute的优势在于“灵活性和普遍性”。该工具的手术操作精确度仅用于替代最有可能脱落的丰度,并可用于任何类型的单细胞基因表达分析。

Vivian Li对模拟和实际数据的全面测试其中一些提供了实际基因表达水平的经验证据scImpute比其他方法更准确。该软件能够可靠区分辍学基因和完全不表达的基因,并提供实际丰度的准确估计。

开源软件可作为广泛使用的用于统计分析的科学计算平台(称为R编程环境)的附件在线免费提供。

两位研究人员已经证明,当辍学率较低时,scImpute在小组细胞中表现良好。但在大量人群中,辍学率可能超过90%的基因。他们的下一个目标是在这些情况下使工具可靠。通过从其他基因(而不仅仅是其他细胞)和在线数据库中借用信息,他们相信scImpute可以成为适用于所有情况的强大工具。

这项研究得到了PhRMA基金会信息学基础研究入门奖,以及国家科学基金会数学科学部和国家卫生研究院国家普通医学研究所的资助。

(选自《医药》(适用版))

法律声明 | 文明公约 | 互助合作 | 联络我们
Copyright © 2006 www.cpde.org.cn 京ICP备10010770号-2
管理机构(主办方):全国医药技术市场协会
邮编:100035 电话:010-88377790 邮箱: yyxh1005@sina.com hyb@cpde.org.cn