转录组分析之--利用DESeq2进行差异基因的筛选

转录组分析算是比较常见的生物信息分析内容,加之最近确实有课题与之相关,无论如何,花些时间自己做一遍增加理解也可以接受.
1.DESeq2的安装
source(“https://bioconductor.org/biocLite.R")
biocLite(“DESeq2”)
2.读取数据

library(DESeq2)
data<-read.table("W_H_S_30min.readcount.txt",header=T,row.names=1)
head(data)

design<-rep(c(“W10”,”H10”,”S10”,”W30”,”H30”,”S30”,”W60”,”H60”,”S60”,”W240”,”H240”,”S240”),each=3)#3类处理,9个样本

3.构建dds对象
colData <- data.frame(row.names=colnames(data),group_list=design)
dds <- DESeqDataSetFromMatrix(countData = data,colData = colData,design = ~group_list)
4.做normalization
dds2 <- DESeq(dds)
5.提取数据
res <- results(dds2, contrast=c(“group_list”,”S30”,”W30”))#这里提取的是S30与W30作比较
resOrdered <- res[order(res$padj),]
resOrdered=as.data.frame(resOrdered)
head(resOrdered)
6.进行数据的过滤
要选择fold change大于4,padj小于0.05|0.01的基因
final.res <- na.omit(resordered[abs(resordered$log2foldchange)>2 & resOrdered$padj<0.01,])
write.table(final.res,”S30_W30_Sigene.txt”,sep=”\t”)

Share (本文总阅读量 次)