大佬教程收集整理的这篇文章主要介绍了使用 R 从 file_name 中提取样本名称,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我的数据包含一个 file_name 列,其中 file_name 如下所示:
10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt
我的目标是从中提取样本名称“X1-211181-XYZW”。我可以使用 R 中的什么函数来获得所需的结果?
您的问题令人困惑,但我仍然理解您想从文件“10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt”中提取“样本名称”列。 如果是这样,那么您可以从文件 df1 中对列进行子集
samplename <- subset(df1,SELEct = c(3,5,14))
3,4,15是你的列号,你可以改成样品名列号
你也可以这样做
Samplename <- df1[,c(1,3:5)]
1,3,5 是您的列号,您可以将其更改为样品名称列号。
您可以使用 dput 函数使其成为由逗号或 data.frame 分隔的单行名称,以恢复到列。
,我认为您正在寻找的是正则表达式。您可以在 R 包 Stringr 中使用正则表达式。这是一个例子:
library(Stringr)
file_name <- "10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt"
regex_Patten <- "[:alpha:]\\d-\\d{6}-[:alpha:]{4}"
str_extract(String = file_name,pattern = regex_Patten)
以上是大佬教程为你收集整理的使用 R 从 file_name 中提取样本名称全部内容,希望文章能够帮你解决使用 R 从 file_name 中提取样本名称所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。