Homework_2020Bioinformatics

DE & R

Posted by Yajin on October 12, 2020

YajinMo_Homework_2020/10/12

Task01

提交差异表达的gene的 name,注明相关的fold change, p-value,FDR(q value) 等信息, 并提交绘制的 Volcano Plot。(基因列表和图最好放到一个word/pdf文件中提交)。

Figure1.差异基因List

Figure1.差异基因表,根据 pvalue<0.05 & qvalue>0.05 条件筛选出差异基因,其fold-change因为dropout变为正负无穷值。

Figure2.火山图

Task02

寻找 differentially expressed genes/transcripts时要对数据做怎样的处理?这些处理有哪些统计学上的考虑?

Y.MO: 对于两个生物对照来说,fold-change和置信度指标是差异分析的主要目标,因此对于数据中零数据以及dropout带来的问题需要有针对性的处理,不管是从湿实验的角度提高测序深度,亦或者是干实验的角度利用机器学习模拟非零值/提前去除零值。

Task03

用R语言实现vcd包的一系列任务

  1. 安装vcd包(一个用于可视化类别数据的包)
1
install.packages("vcd")
  1. 列出此包中可用的函数和数据集。
1
help(package="vcd")

Figure3

  1. 载入这个包并阅读数据集Arthritis的描述。
1
library(vcd)

Figure4

  1. 显示数据集Arthritis的内容(直接输入一个对象的名称将列出它的内容)。
1
Arthritis

Figure5

  1. 运行数据集Arthritis自带的示例(尝试用example命令)。
1
example(Arthritis)

Figure6