程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了使用 R 从 file_name 中提取样本名称大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决使用 R 从 file_name 中提取样本名称?

开发过程中遇到使用 R 从 file_name 中提取样本名称的问题如何解决?下面主要结合日常开发的经验,给出你关于使用 R 从 file_name 中提取样本名称的解决方法建议,希望对你解决使用 R 从 file_name 中提取样本名称有所启发或帮助;

我的数据包含一个 file_name 列,其中 file_name 如下所示:

10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt

我的目标是从中提取样本名称“X1-211181-XYZW”。我可以使用 R 中的什么函数来获得所需的结果?

解决方法

您的问题令人困惑,但我仍然理解您想从文件“10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt”中提取“样本名称”列。 如果是这样,那么您可以从文件 df1 中对列进行子集

samplename <- subset(df1,SELEct = c(3,5,14))

3,4,15是你的列号,你可以改成样品名列号

你也可以这样做

Samplename <- df1[,c(1,3:5)]

1,3,5 是您的列号,您可以将其更改为样品名称列号。

您可以使用 dput 函数使其成为由逗号或 data.frame 分隔的单行名称,以恢复到列。

,

我认为您正在寻找的是正则表达式。您可以在 R 包 Stringr 中使用正则表达式。这是一个例子:

library(Stringr)
file_name <- "10300136747-X1-211181-XYZW-214-12D5-1_S81_mutect2_variants_joint.txt"
regex_Patten <- "[:alpha:]\\d-\\d{6}-[:alpha:]{4}"
str_extract(String = file_name,pattern = regex_Patten)

大佬总结

以上是大佬教程为你收集整理的使用 R 从 file_name 中提取样本名称全部内容,希望文章能够帮你解决使用 R 从 file_name 中提取样本名称所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。