程序问答   发布时间:2022-06-02  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误??

开发过程中遇到从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?的问题如何解决?下面主要结合日常开发的经验,给出你关于从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?的解决方法建议,希望对你解决从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?有所启发或帮助;

基本上,我有一个从互联网上编译的 .txt 语料库。为了使用其他一些分析工具(DecisionTreeClassifIEr、bar Plots、TFID 等),我尝试使用我在互联网上找到的代码将这个语料库转换为数据集(更多解释:https://progrAMMinghistorian.org/en/lessons/analyzing-documents-with-tfidf)>

我将我的语料库向量化为数组:

vectorizer = TfIDfVectorizer(max_df=.65,min_df=1,use_IDf=True,norm=NonE)
doc1= vectorizer.fit_transform(doc1withoutskipwords)

vectorizer = TfIDfVectorizer(max_df=.65,norm=NonE)
doc2= vectorizer.fit_transform(doc2withoutskipwords)

doctr1 = doc1toarray()
len(doctr1)

doctr2 = doc2.toarray()
len(doctr2)

Path("myname/nltk_data/tf_IDf_output").mkdir(parents=True,exist_ok=TruE)
output_filenames = [str(txt_filE).replace(".txt",".csv").replace("txt/","tf_IDf_output/") for txt_file in doc1withoutskipwords]
for counter,doc in enumerate(poltrans):
    tf_IDf_tuples = List(zip(vectorizer.get_feature_names(),doC))    
    one_doc_as_df = pd.DataFrame.from_records(tf_IDf_tuples,columns=['term','score']).sort_values(by='score',ascending=falsE).reset_index(drop=TruE)
    one_doc_as_df.to_csv(output_filenames[counter])

然后我收到这个错误:IsADirectoryError: [Errno 21] Is a directory: 'documents'

我能够分别运行 Path 和 output_filenames 代码行并且它们起作用了。我在我想要的地方有 tf_ID_output 文件。但是,我无法解决其余的问题。

我是一个非常初级的 Python 编码员,所以我很困惑。

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

大佬总结

以上是大佬教程为你收集整理的从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?全部内容,希望文章能够帮你解决从语料库创建新数据集时,如何克服 Python 中的 Errno 21 错误?所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。