程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了将样本信息添加到 PCA (R) 中的数据集大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决将样本信息添加到 PCA (R) 中的数据集?

开发过程中遇到将样本信息添加到 PCA (R) 中的数据集的问题如何解决?下面主要结合日常开发的经验,给出你关于将样本信息添加到 PCA (R) 中的数据集的解决方法建议,希望对你解决将样本信息添加到 PCA (R) 中的数据集有所启发或帮助;

我是生物学家,不是程序员,所以请保持温和。

所以我有一个看起来像的数据集

Genes  PatIEnt1   PatIEnt2   PatIEnt3
A          324      433         343
B          431       342        124
Z          232       234        267

然后我有样本表,其中包含样本信息,例如:

PatIEnt1 - Healthy
PatIEnt2 - disease
PatIEnt3 - Healthy

我正在使用:

library(ggfortify)
df <- dataset
pca_res <- prcomp(df,scale. = TRUE)

autoplot(pca_res)

那我想做

autoplot(pca_res,data = ?,colour = '?')

我希望使用样本表中的信息使用自动绘图功能根据状态(健康/疾病)为我的 PCA 着色。有没有办法做到这一点?

解决方法

首先,我将创建一个包含所有可用信息的完整 data.frame。

例如,您需要创建这种 data.frame :

df=structure(list(A = c(324,433,343),B = c(431,342,124),Z = c(232,234,267),Status = c("Healthy","Disease","Healthy")),row.names = c("Patient1","Patient2","Patient3"),class = "data.frame")

之后,您可以使用非常方便绘制 PCA 的 factoextra 包:

pca_res <- prcomp(df,scale. = TRUE)
library(factoextra)
fviz_pca_ind(pca_res,habillage=df$Status)

之后可以查看fviz_pca_ind文档修改颜色

编辑:

从您的 2 个数据集创建整个数据框:

1) 取第一个数据框并将第一列作为行名

rownames(df)=df$Genes
df=df[,-1] #remove the gene column in order to keep only the values

2) 格式化你的第二个数据框 您应该将其格式化为与 df (Patient1,Patient2,...) 具有相同的列,每个列都有疾病状态,您将称之为 df2

df2
rownames(df2)=c("Status")

Patient1   Patient2   Patient3
Healthy   Disease   Healthy

我们不知道您的数据,因此您必须自己执行此操作

3) 然后你绑定 df 和 df2

df3=rbind(df,df2)
df3=data.frame(t$df)

然后使用 df3 执行 PCA

大佬总结

以上是大佬教程为你收集整理的将样本信息添加到 PCA (R) 中的数据集全部内容,希望文章能够帮你解决将样本信息添加到 PCA (R) 中的数据集所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。