自单细胞测序技术横空出世以来,由于其可以将测序缩小到单个细胞的单位内进行,对于更加全面精确地了解生物基因表达情况具有重要意义。但是,由于单细胞测序本身的技术特点,尽管我们可以得到单个细胞的表达信息,但是细胞在原本组织内的空间位置信息是完全丢失的,这些信息在理解细胞微环境或细胞间互作时同样关键。
为了解决这个问题,空间转录组技术出现了,这项技术可以在组织原位上以接近单个细胞大小的尺度来进行转录组测序,但因为技术限制以及生物组织本身的复杂性,空间转录组还不能精确提供单个细胞尺度上的转录组信息。
单细胞测序技术具有单个细胞的精度,空间转录组提供了组织原位的信息,因此将两者结合起来就能近似得到完整的信息。目前已经有许多分析工具试图将空间信息与单细胞信息整合起来,并且取得了一定的进展。本文将介绍的celltrek就是其中之一。
目前常用的整合算法有许多,例如去卷积,通过推断spot内的细胞组成来将两者整合在一起。而celltrek则另辟蹊径,通过直接推断单细胞的空间坐标来实现信息的补全。cell trek的计算原理可见下图。简单来说,该方法首先将单细胞数据与空间转录组数据整合,共嵌入到(coembed)共同的隐空间内,然后从中抽出空间转录组的数据作为训练数据集,使用随机森林模型(random forests,rf)从spot的基因表达情况预测其空间坐标。这里所依据的基本思路就是,细胞在组织中的分布并不是随机混乱的,同一类细胞大多都是集中于同一片区域。
空间转录组的数据还会同时进行非线性插值增强其空间分辨率。然后,将整个共嵌入矩阵输入训练好的模型,生成一个衡量单细胞与空间spot之间表达相似性的rf距离矩阵,基于这个矩阵使用相互最近邻域算法(mutual nearest neighbors,mnn)生成一个spot-细胞稀疏图,最后根据细胞在稀疏图上的相邻spot推断出细胞的空间坐标。因为相同类型的细胞拥有较为相似的基因表达,所以基于空间转录组数据训练的模型可以用来预测细胞的位置坐标。
01
这一算法的优势在于将细胞直接定位到组织切片照片上,而不是像去卷积类方法那样计算每个spot内的细胞类型比例。直接定位带来的另一个好处就是在接下来的数据分析中可操作性大大提高了,像去卷积类方法得到的细胞比例矩阵我们很难再对其进行什么操作,但是我们可以对celltrek 整合后的结果进行细胞共定位分析、基因空间权重共表达分析等等,因为他本质仍然是单细胞数据,只是附带上了空间坐标。
以小鼠大脑皮层的空转数据与单细胞数据为例,我们最后得到的结果会是这样的。可以看到不同类型的细胞在空间上呈现出明显的层状分布,这符合大脑皮层的结构特征,并且不同的细胞类型出现在了它们应该出现的皮层位置。 02
内测数据结果
celltrek的缺点在于,第一,对计算资源的需求比较大,当单细胞数据量较大时会花费比较长的时间;第二,对于空转数据与单细胞数据的匹配度要求比较高,也就是说空转数据与单细胞数据最好取自同一块组织区域,不要出现无法匹配的空间区域或细胞类型,否则最终结果会非常混乱,如下图。
03
内测数据结果
总而言之,celltrek提供了一条不同于当下其他单细胞-空转整合分析方法的道路,结果更加接近生物组织中的实际情况,并为整合后的下游分析提供了便利。
贴片天线的技术原理是怎样的
王健林宣布万达正式告别房地产!万达退出房地产市场,马云入局租赁市场,房地产行业命运该如何?
Yelp最近又火了一把,基于一次失败的“被删库”体验
LTE语音业务相关技术和建议
蓝牙技术在短距离无线遥控中的应用
CellTrek单细胞空间转录组联合分析
剖析全自动生化分析仪的定义及功能
拥有人工智能的小米MIX2S_你期待吗
紫光展锐推出全球首款基于DYNAMIQ架构的4核LTE平台--虎贲T310
EUV光刻机的价值 芯片厂商造不出7nm以下工艺芯片
厚膜电路(HIC)技术基础知识
智能座舱,智能汽车的兵家必争之地
推进AIoT项目落地的实操方法
四轴飞行器的机身折叠机制设计模仿药丸虫
美国县城将道路标识转换为LED
DC/DC 转换器电路基础知识和演示电路分析过程
DS18B20的时序及代码解析
荣耀9评测:华为荣耀9配置价格一览,还有隐藏的实用技巧和高逼格的配件,你还不心动?
锂电池全面替代铅酸面临的三座大山
ARM最新IP工具套件,系统级芯片开发从数月缩短至数天