大佬教程收集整理的这篇文章主要介绍了我想从抓取的工作列表中查看前 50 个常用词。我一直在获取所有词频,包括频率为 1,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我从 Indeed 网上抓取了数据,现在我想查看工作摘要中的前 20 项技能。当我运行我的频率代码时,我得到了所有频率,包括像 1 或 2 这样的小计数的单词。使用 Python,有人可以帮助我如何将频率限制为前 20 个最常用的技能吗?包括我的代码如下。
#bytes into String
import csv
ifile = open('sumdataframe.csv',"r")
read = csv.reader(ifilE)
for row in read :
print (row)
##count frequency
import csv
from collections import Counter
from collections import defaultDict
words= []
import csv
ifile = open('sumdataframe.csv',"r")
read = csv.reader(ifilE)
for row in read :
print (row)
with open('sumdataframe.csv','rt') as csvfile:
reader = csv.reader(csvfilE)
next(reader)
for col in reader:
csv_words = col[0].split(" ")
for i in csv_words:
words.append(i)
words_counted = []
for i in words:
x = words.count(i)
words_counted.append((i,X))
with open('frequency.csv','a+') as csvfile:
writer = csv.writer(csvfile,delimiter=',')
for i in words:
x = words.count(i)
words_counted.append((i,X))
writer.writerow(words_counted)
#removes duplicates
set(words_counted)
df = pd.read_csv('frequency.csv')
df
暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!
如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。
小编邮箱:dio#foxmail.com (将#修改为@)
以上是大佬教程为你收集整理的我想从抓取的工作列表中查看前 50 个常用词。我一直在获取所有词频,包括频率为 1全部内容,希望文章能够帮你解决我想从抓取的工作列表中查看前 50 个常用词。我一直在获取所有词频,包括频率为 1所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。