大佬教程收集整理的这篇文章主要介绍了从数据框中的集合中获取单词?,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个数据框列“地址”,每一行都有这样的值:
3466B,jerome Avenue,The bronx,bronx county,New York,10467,United States,(40.881836199999995,-73.88176324294639)
Jackson Heights 74th Street - Roosevelt Avenue (7),75th Street,Queens,Queens county,11372,(40.74691655,-73.8914737373454)
我只需要保留每一行的值 bronx/Queens/Manhattan/Staten Island。
有没有办法做到这一点? 提前致谢。
一种选择是,假设值总是在同一个地方。使用 .split(',')[2]
"3466B,jerome Avenue,The Bronx,Bronx county,New York,10467,United States,(40.881836199999995,-73.88176324294639)".split(',')[2]
如果源文件是 CSV(逗号分隔值),我会查看 pandas 和 pandas.read_csv('filename.csv')
并利用 pandas 中的所有优秀功能。
如果值不在同一个位置,并且您只需要一个是否在一组值中:
import pandas as pd
df = pd.DataFrame(["The Bronx","Queens","Man"])
df.isin(["Queens","The Bronx"])
,
您可以添加一列,我们称其为“区”,然后像这样填充它。
import pandas as pd
df = pd.DataFrame({'address':["3466B,-73.88176324294639)","Jackson Heights 74th Street - Roosevelt Avenue (7),75th Street,Queens,Queens county,11372,(40.74691655,-73.8914737373454)"]})
di@R_696_10495@cts = ['Bronx','Queens','Manhattan','Staten Island']
df['di@R_696_10495@ct'] = ''
for di@R_696_10495@ct in di@R_696_10495@cts:
df.loc[df['address'].str.contains(di@R_696_10495@ct),'di@R_696_10495@ct'] = di@R_696_10495@ct
print(df)
以上是大佬教程为你收集整理的从数据框中的集合中获取单词?全部内容,希望文章能够帮你解决从数据框中的集合中获取单词?所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。