程序问答   发布时间:2022-06-01  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了比较数据框python中具有相同列的不同行大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决比较数据框python中具有相同列的不同行?

开发过程中遇到比较数据框python中具有相同列的不同行的问题如何解决?下面主要结合日常开发的经验,给出你关于比较数据框python中具有相同列的不同行的解决方法建议,希望对你解决比较数据框python中具有相同列的不同行有所启发或帮助;

我有两个数据框。

Dataframe # 1 input :
abc.Json.gz
cde.Json.gz
efg.Json.gz

#dataframe 1

file_val = pd.DataFrame(val,columns=['filename']) # dataframe 1

Dataframe # 2 input :
ghi.Json.gz
abc.Json.gz
cde.Json.gz
mno.Json.gz
xyz.Json.gz

#dataframe 2

rds_rcd = pd.read_sql_query('''SELEct filename from tablename where cast(event_date as datE) = '{0}' '''.format(self.timestr),conn) 

Below code to check if there are any common records between both dataframe # 1 and daframe # 2

file_val['status'] = np.where(file_val['filename'].values != rds_rcd['filename'].values,'false','True')

上述两个数据框具有相同的列(文件名),但记录数不同。

问题: 即使两个数据框中都存在“abc.Json.gz”和“cde.Json.gz”,但仍将值视为“false”所有记录。

   filename    status                                            
0  abc.Json.gz  false
1  cde.Json.gz  false

任何建议都会很棒。

解决方法

假设您有 2 个数据帧 df1 和 df2,例如:

df1:
    filename
0   abc.json.gz
1   cde.json.gz
2   efg.json.gz  

df2:  
    filename
0   ghi.json.gz
1   abc.json.gz
2   cde.json.gz
3   mno.json.gz
4   xyz.json.gz

您可以通过以下方式找到常用的文件名集:

common_files = set(df1['filename'].to_list()).intersection(set(df2['filename'].to_list()))  

这产生:

{'abc.json.gz','cde.json.gz'}

大佬总结

以上是大佬教程为你收集整理的比较数据框python中具有相同列的不同行全部内容,希望文章能够帮你解决比较数据框python中具有相同列的不同行所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签: