-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy pathreport.Rmd
52 lines (34 loc) · 2.07 KB
/
report.Rmd
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
项目分析报告
======
# 一、测序数据预处理
MiSeq测序得到的PE reads首先根据overlap关系进行拼接,同时对序列质量进行质控和过滤,区分样品后进行OTU聚类分析和物种分类学分析,从而得到样品的OTU谱和各级别物种分类谱。基于这些谱,可以进行样品内和样品间的各种多样性分析、群落结构分析等。在上述分析的基础上,可以根据样品分组信息进一步得到有生物学意义的结果。详细分析方法和结果见以下部分。
#### 软件平台:
> 1. **Qiime 1.9.1**
> 2. Python 2.7.12 *Continuum Analytics, Inc.*
> 3. R version 3.3.1 (2016-06-21)
#### 数据库版本:
> 1. GreenGene 13_8
> 2. KEGG
# 二、项目分析方法与结果
### 2.1 菌群群落组成柱状图
### 2.2 PCA主成分分析
```{r echo = FALSE}
pca.res <- PCA()
pca.li <- pca.res$li[,1:2]
pca.eig <- pca.res$eig[1:20]
pch <- rep(17,length(p))
pch[b] <- rep(15)
plot(pca.li,col=pch-13,pch=pch,xlab="PC1",ylab="PC2",main="")
plot(pca.eig,type='b',col='red')
```
PCA分析(Principal Component Analysis),即主成分分析,是一种分析和简化数据集的技术。主成分分析经常用于减少数据集的维数,同时保持数据集中的对方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。
这样低阶成分往往能够保留住数据的最重要方面。通过分析不同样品物种组成可以反映样品的差异和距离,PCA 运用方差分解,将多组数据的差异反映在二维坐标图上,坐标轴取能够最大反映方差值两个特征值。如果两个样品距离越近,则表示这两个样品的组成越相似。不同处理或不同环境间的样品可能表现出分散和聚集的分布情况,从而可以判断相同条件的样品组成是否具有相似性。
### 2.3 shannon多样性
### 2.4 人群聚类分析
### 2.5 分组差异检验
### 2.6 差异物种热图可视化
### 2.7 特征物种相关性网络分析
### 2.8 疾病分类器构建
```{r echo = FALSE}
plot(rf(),main="")
```