YajinMo_Homework_2020/10/12
Task01
提交差异表达的gene的 name,注明相关的fold change, p-value,FDR(q value) 等信息, 并提交绘制的 Volcano Plot。(基因列表和图最好放到一个word/pdf文件中提交)。
Figure1.差异基因表,根据 pvalue<0.05 & qvalue>0.05 条件筛选出差异基因,其fold-change因为dropout变为正负无穷值。
Task02
寻找 differentially expressed genes/transcripts时要对数据做怎样的处理?这些处理有哪些统计学上的考虑?
Y.MO: 对于两个生物对照来说,fold-change和置信度指标是差异分析的主要目标,因此对于数据中零数据以及dropout带来的问题需要有针对性的处理,不管是从湿实验的角度提高测序深度,亦或者是干实验的角度利用机器学习模拟非零值/提前去除零值。
Task03
用R语言实现vcd包的一系列任务
- 安装vcd包(一个用于可视化类别数据的包)
1
install.packages("vcd")
- 列出此包中可用的函数和数据集。
1
help(package="vcd")
- 载入这个包并阅读数据集Arthritis的描述。
1
library(vcd)
- 显示数据集Arthritis的内容(直接输入一个对象的名称将列出它的内容)。
1
Arthritis
- 运行数据集Arthritis自带的示例(尝试用example命令)。
1
example(Arthritis)