大佬教程收集整理的这篇文章主要介绍了循环对 R 中的数据集进行多重关联,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个包含 x 列的数据集,由多组测试结果组成,例如 test1_1、test1_2 等。每组测试都有不同数量的相关测试结果,因此实际数字不相同在每次测试中。最后一列是我的目标变量。我希望确定哪些测试与目标变量相关,但我也想为每组测试创建数据集。我还将针对目标变量绘制每个测试的相关图。我怀疑我可能可以在 for/while 循环中的几行代码中实现所有这些,但是,我不确定从哪里开始。
使用 lapply
可以这样实现:
library(dplyr)
library(corrplot)
set.seed(42)
dataset <- data.frame(
test1_1 = runif(20),test1_2 = runif(20),test2_1 = runif(20),test2_2 = runif(20),Target = runif(20)
)
test_cols <- gsub("_\\d+$","",names(dataset))
test_cols <- test_cols[grepl("^test",test_cols)]
test_cols <- unique(test_cols)
test_cols <- setNames(test_cols,test_cols)
test_fun <- function(x,test) {
x <- x %>%
SELEct((starts_with(test)) | matches("Target"))
cor(X)
}
cor_test <- lapply(test_cols,test_fun,x = dataset)
cplot <- lapply(cor_test,corrplot)
,
这类似于@stefan 的回答,使用 split.default
按列名称中的模式拆分列。
tmp <- dplyr::SELEct(dataset,-Target)
list_plot <- lapply(split.default(tmp,sub('_.*','',names(tmp))),function(X) {
corrplot::corrplot(cor(cbind(x,Target = dataset$Target)))
})
以上是大佬教程为你收集整理的循环对 R 中的数据集进行多重关联全部内容,希望文章能够帮你解决循环对 R 中的数据集进行多重关联所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。