分类导航

HTML 发布时间：2022-04-14 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了无法将语料库转换为R中的数据框架，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

我已经看过这里发布的其他类似问题(如 this),但问题仍然存在.

我有一个文本数据的数据框,我需要阻止它.因此,我将其转换为语料库,然后将其转换为词干,然后完成词干中的单词,然后尝试将文本数据框作为输出.

@H_199_4@myCorpus <- Corpus(Vectorsource(textDf$text)) myCorpus <- tm_map(myCorpus,removeWords,stopwords('english')) myCorpus <- tm_map(myCorpus,content_transformer(tolower)) myCorpus <- tm_map(myCorpus,removePunctuation) DictCorpus <- myCorpus myCorpus <- tm_map(myCorpus,stemDocument) myCorpus <- tm_map(myCorpus,stemCompletion,Dictionary=DictCorpus)

现在我正试图从这个语料库中获取一个数据帧,所以我尝试了以下命令.

dataframe< -data.frame(text = unlist(sapply(myCorpus,'[',“content”)),
StringsAsFactors = F)

和

dataframe< -data.frame(text = unlist(sapply(myCorpus,[)),StringsAsFactors = F) 并且

dataframe <- 
    data.frame(id=sapply(corpus,meta,"id"),text=unlist(lapply(sapply(corpus,"content"),paste,collapse="\n")),StringsAsFactors=falSE)

从this链接

所有这些都会产生以下错误：

Error in UseMethod("meta",X) : 
  no applicable method for 'meta' applied to an object of class "character"

任何帮助将不胜感激.

解决方法

这应该这样做：

data.frame(text = sapply(myCorpus,as.character),StringsAsFactors = falSE)

用工作解决方案编辑,以原油为例

这里的问题是你不能将stemCompletion应用为转换.

getTransformations()
## [1] "removenumbers"     "removePunctuation" "removeWords"       "stemDocument"      "StripWhitespace"

不包括stemCompletion,它将带有标记的标记的向量作为输入.

所以这应该这样做：首先提取转换后的文本并标记它们,然后完成词干,然后粘贴在一起.在这里,我使用内置的粗语料库说明了解决方案.

data(crudE)
myCorpus <- crude 
myCorpus <- tm_map(myCorpus,stemDocument)
# tokenize the corpus
myCorpusTokenized <- lapply(myCorpus,scan_tokenizer)
# stem complete each token vector
myTokensStemCompleted <- lapply(myCorpusTokenized,DictCorpus)
# concatenate tokens by document,create data frame
myDf <- data.frame(text = sapply(myTokensStemCompleted,collapse = " "),StringsAsFactors = falSE)

大佬总结

以上是大佬教程为你收集整理的无法将语料库转换为R中的数据框架全部内容，希望文章能够帮你解决无法将语料库转换为R中的数据框架所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：r 中将数据无法框架语料库转换

上一篇: 模板文字中的Atom HTML语法高亮(... 下一篇:表单 – 如何在Joomla中以正确的...

猜你在找的HTML相关文章

html – 在不同的事件中CSS多重转换为相同的元素 2022-04-15
使用python绘制图形并使用HTML显示它 2019-10-08
使用JQuery很好地将DOM元素添加到DOM 2019-10-08
将值重新加载到数组中比javascript中的最后一个位置发生一个位置 2019-10-08
jquery – 在SELECT框中更改文本颜色 2019-10-08
Html表,使一行更大 2019-10-08
javascript – 使用Puppeteer,Mocha和Chai在html标记属性中断言文本的存在 2019-10-08
javascript – React：设置div的scrollTop属性不起作用 2019-10-08
html – 创建水平居中的背景图像渐变三角形 2019-10-08
javascript – 如何在Plyr JS的视频播放器中添加下载按钮？ 2019-10-08