聊城开发网站建设,沈阳开发网站公司,网站原型设计和版式设计,国外设计网站app有哪些近一段时间正在努力学习单细胞相关的理论知识#xff0c;发现单细胞测序和普通的真核细胞的转录组非常相似。两者之间的最大的区别在于#xff0c;一个测的是单个细胞的表达#xff0c;一个测的是一堆细胞的表达之和。所以从这里就可以理解#xff0c;为什么网上很多教程都…近一段时间正在努力学习单细胞相关的理论知识发现单细胞测序和普通的真核细胞的转录组非常相似。两者之间的最大的区别在于一个测的是单个细胞的表达一个测的是一堆细胞的表达之和。所以从这里就可以理解为什么网上很多教程都在说单细胞数据是一个巨大的稀疏矩阵。假设一个样本可以捕获一万个细胞这时候单细胞的矩阵大小为2w个基因*样本数*1万个细胞而转录组数据的大小2w个基因*样本数。两个矩阵相差了一万倍巨大一词就是从此处而来。
我们要理解不是所有的细胞都要表达2w个基因细胞在机体内有各自的分工所以有的细胞可能就只表达了几百个基因有的是几十个有的是几千个所以单细胞数据中会存在大量的零这种数据又被称为稀疏矩阵。
那我们怎么做单细胞分析呢
目前生信豆芽菜提供了两版单细胞分析工具
老版http://www.sxdyc.com/singleCellTool 为了更加简单方便的使用单细胞分析又推出了新版工具新版本更加契合零基础的用户。首先我们大致了解单细胞基本分析包括哪些
数据读取质控过滤去批次亚群聚类marker基因的筛选特征基因的表达新增注释信息。
基本分析基本已经满足了常规的套路文章3分加点单细胞验证的水平比如说之前我们上线零代码复现2基于某一个特征基因集建模分型最后筛选到关键的基因这时候我们可以使用单细胞的基础分析工具盒进行简单的验证。
首先进入生信豆芽菜官网http://www.sxdyc.com/index 目前只上线了一个基础分析的版本后续会对其他分析陆续进行上线
接下来我们看看怎么进行单细胞的基础分析
第一步细胞读入质控 这里有三种格式的数据选择记得先下载示例数据看一下再开始进行分析 这三个压缩包都是都是可以直接使用的数据。
这里我们以10x的数据为例10x的标准数据一个样本一个文件夹每一个文件夹包含了三个文件 然后全选这三个文件夹压缩为zip上传即可。 提交后输入任务队列名 运行成功后下载文件 第一个相关性越大越好后面两个相关的越小越好
通过小提琴图展示形式选择第二步细胞过滤的阈值。
第二步细胞的过滤 这里根据第一步生成的vlnPlot.befor.pdf输入筛选的阈值这里的UMI就是图中的ncount基因数量为nfeature线粒体的百分比含量为percent.mt。
如这里UMI的默认写了10050000则默认为100UMI50000。双向的选择也是为了剔除细胞碎片和双细胞那么选多少合适呢选多少都可以没有固定的标准。
提交等待运行成功就可以了 第三步去批次 在第二步中通过TSNE/UMAP的图查看样本细胞的分布如果不同样本之间泾渭分明差别很大则选择去批次的方法如果各个样本之间相互杂糅你中有我我中有你可以选择不去批次这时候直接选择none即可。 这两个图即是去批次后的tsne/UMAP图。
第四步亚群聚类
输入分辨率输入的数值越大分的亚群越多默认输入0.1的分辨率 细胞的一个分组信息 第五步特征基因表达的气泡图该步骤可以运行也可以不运行
该步骤设计的主要有两个
1、做亚群手动注释需要我们提前查找文献筛选细胞marker基因。
2、查找某一个特定的功能集中的基因的表达情况
这里我随便找了几个基因进行绘图 这里的基因表达颜色是从低到高不管选几个颜色都是可以的 第六步新增注释信息
这里默认会对meta的信息进行整理先导入数据 根据需求新增注释信息每选择一次需要提交可以提交多次如果是亚群注释的信息列名需要改为cell_type 第七步marker基因的筛选
如果在第六步进行亚群注释新增了一列cell_type即可针对注释后的亚群进行marker基因的筛选如果没有进行亚群注释只能选择注释前也就是聚类seurat_clusters进行marker基因的筛选 到这一步基础分析就做完了操作简单调理清晰是不是有眼前一亮的感觉也许这就是真正在用心做的平台吧会想要关心用户的使用。