分类导航

程序问答发布时间：2022-06-02 发布网站：大佬教程 code.js-code.com

大佬教程收集整理的这篇文章主要介绍了为文本分析高效创建词法单元，大佬教程大佬觉得挺不错的，现在分享给大家，也给大家做个参考。

如何解决为文本分析高效创建词法单元？

开发过程中遇到为文本分析高效创建词法单元的问题如何解决？下面主要结合日常开发的经验，给出你关于为文本分析高效创建词法单元的解决方法建议，希望对你解决为文本分析高效创建词法单元有所启发或帮助；

我对文本分析比较陌生，我遇到了一些必须有 a) 名称和 b) 处理它的罐头程序，但我没有的话知道从哪里开始寻找。

这是一个提供上下文的示例管道。然而，我对这篇文章唯一感兴趣的部分是 @H_174_3@mutate 内部发生的事情。

w2 <- warnIE %>%
  SELEct(ID,dislikes) %>% 
  unnest_tokens(input = dislikes,output = 'word') %>%
  anti_join(no_negation) %>% 
  group_by(ID) %>% 
  summarize(dislikes = paste(word,collapse = ' ')) %>% 
  ungroup() %>%
  mutate(dislikes = str_@R_262_9363@ce(dislikes,fixed('not '),'not_'),dislikes = str_@R_262_9363@ce(dislikes,fixed('bernIE sanders'),'bernIE_sanders'),fixed('joe bIDen'),'jb'),fixed('democratic party'),'dp'),fixed('green new deal'),'gnd'),fixed('donald trump'),'trump')) %>% 
  unnest_tokens(input = dislikes,output = 'bigram',token = 'ngrams',n = 2) %>%
  count(bigram)

如您所见，我正在做的是创建确保多词词汇单位是可识别的词，unigrams -- 好吧，我还将“not”附加到它否定的任何内容上，这是一个略有不同的问题.

但我想知道经验丰富的文本分析师是做什么的？我知道您肯定会创建一个函数而不是让它占用管道中的多少行，但即使在一个函数中，单个调用 str_@R_262_9363@ce （或 grep 如果更多你的风格）一定非常低效。

解决方法

暂无找到可以解决该程序问题的有效方法，小编努力寻找整理中！

如果你已经找到好的解决方法，欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@）

大佬总结

以上是大佬教程为你收集整理的为文本分析高效创建词法单元全部内容，希望文章能够帮你解决为文本分析高效创建词法单元所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错，欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ：384754419，请注明来意。

标签：为文本分析高效创建词法单元

上一篇: 如何在 Pytorch 中测试自定义数据... 下一篇:Android FCM 通知未弹出

猜你在找的程序问答相关文章

在烧瓶中重定向时发出POST请求 2022-06-02
从 CreateWindow() 返回的 HWND 的格式值是多少？ 2022-05-31
使用nodejs打印json对象内容 2022-05-31
useEffect 无限循环仅在测试时发生，否则不会发生 - 尽管使用 useReducer 2022-05-31
从雅虎财经检索 ESG 分数 2022-05-31
Gulp：获取“必须指定任务功能”错误，但我只有 1 个任务 2022-05-31
JavaScript 将平面数组转换为嵌套/分组和排序数组 2022-05-31
405 Method Not Allowed 当提交表单到 Flask 时，即使路由有 ['GET', 'PO... 2022-05-31
Mongodb 错误码和对应的 http 状态码 2022-05-31
连接到上游时 Nginx connect() 失败（111：连接被拒绝），客户端：192.168.128.1，服务... 2022-05-31