生物信息之Seurat的安装与使用(basecalling生物信息)

尔云间 一个专门做科研的团队

原创 小果 生信果

欢迎点赞 收藏 关注[给你小心心]

生物信息之Seurat的安装与使用(basecalling生物信息)

什么是Seurat?

Seurat是R语言中被用于单细胞RNA-seq质控、分析的一个r包。从而时用户可以鉴定来自单细胞转录本测定的异质性来源。

其中,Seurat包的应用主要包含了:数据导入、数据过滤、数据归一化、特征选择、数据缩放、数据降维、聚类、数据可视化以及差异表达基因分析的功能。

本文主要讲解Seurat包的安装以及其简单的应用,包括数据导入、数据过滤、数据特征可视化。

Seurat的安装

安装命令

> install.packages('Seurat')

注意:目前Seurat最高版本是3.0版本,需要适配的R的版本在3.4及以上,如果你的R版本在3.4以上,即可直接在R中安装。

安装成功后引用R包可能会出现的错误

生物信息之Seurat的安装与使用(basecalling生物信息)生物信息之Seurat的安装与使用(basecalling生物信息)

此时,我们需要再安装spatstat.data这个包:

> install.packages('spatstat.data')

当安装spatstat.data包时,可能还会出现spatstat.utils和spatstat.data版本不适配的问题,导致spatstat.data无法正确被安装。

安装时报错信息:

Error: package or namespace load failed for ‘Seurat’ in loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]):

载入了名字空间‘spatstat.utils’ 3.0-1,但需要的是>= 3.0.2

此时,我们需要重新下载对应版本的spatstat.utils,并在下载之前删除原来版本的spatstat.utils。

>remove.packages("spatstat.utils")

删除原来版本的r包后,我们需要首先去下载好对应R包的压缩包,这里需要特别注意的是,下载好的必须是.tar,而不能是.zip。这里贴下我下载的链接:

https://mirrors.sjtug.sjtu.edu.cn/cran/web/packages/spatstat.utils/index.html

下载好后,运行以下命令:

>install.packages("C:/下载/spatstat.utils_3.0-1.tar.gz", repos = NULL, type = "source")

(第一个空就填写你下载好的压缩包所在的绝对路径即可)

如果你成功安装了Rtools并且和R以及RStudio在同一目录下,即可成功安装,如果这一步仍然报错,那么你需要检查以下是否正确安装了Rtools,同时也要注意R和RStudio的版本对应问题哦~

以上问题解决后,当我们在R中引用Seurat包就不会报错了!

生物信息之Seurat的安装与使用(basecalling生物信息)

Seurat包的简单使用

经过一番周折,我们成功安装了Seurat包。接下来我们要学习怎样使用Seurat包。

生物信息之Seurat的安装与使用(basecalling生物信息)

导入数据/创建Seurat对象

>library(dplyr)>library(Seurat)#导入pbmc数据>pbmc.data <- Read10X(data.dir="Rdata/filtered_gene_bc_matrices/hg19/")>pbmc <- CreateSeuratObject(counts = pbmc.data, project = "pbmc3k" , min.cells = 3,min.features = 200)>pbmc

生物信息之Seurat的安装与使用(basecalling生物信息)

提示信息告诉我们,生成的pbmc对象中有13714个基因,2700个细胞。

导入成功后,我们也可以在Rstudio中查看pbmc对象的整体结构如下:

生物信息之Seurat的安装与使用(basecalling生物信息)

数据过滤/质量控制

下面,我们以人的数据为例,以MT-开头的所有基因集座位线粒体基因集,利用小提琴图可视化质控指标(过滤条件:过滤线粒体基因占比大于5%的细胞、过滤UMI数大于2500或小于200的细胞)。

>pbmc[["percent.mt"]]<-PercentageFeatureSet(pbmc,pattern = "^MT-")>VlnPlot(pbmc,features = c("nFeature_RNA","nCount_RNA","percent.mt"),ncol = 3)>pbmc<-subset(pbmc,subset=nFeature_RNA>20 & nFeature_RNA <2500 & percent.mt<5)>head(pbmc@meta.data, 5)

生物信息之Seurat的安装与使用(basecalling生物信息)

特征-特征之间关系可视化

接下来,我们可以用FeatureScatter函数可书画特征与特征之间的关系。

>plot3 <- FeatureScatter(pbmc,feature1 = "nCount_RNA",feature2 = "percent.mt")>CombinePlots(plots= list(plot3))

生物信息之Seurat的安装与使用(basecalling生物信息)

以上,就是我们对Seurat包的安装与基本使用方法的总结,不知道有没有帮助到你呢~

生物信息之Seurat的安装与使用(basecalling生物信息)

生信果”,生信入门、R语言、生信图解读与绘制、软件操作、代码复现、生信硬核知识技能、服务器、生物信息学的教程,以及基于R的分析和可视化等原创内容,一起见证小白和大佬的成长。

相关新闻

联系我们
联系我们
在线咨询
分享本页
返回顶部