大佬教程收集整理的这篇文章主要介绍了比较数据框python中具有相同列的不同行,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我有两个数据框。
Dataframe # 1 input :
abc.Json.gz
cde.Json.gz
efg.Json.gz
#dataframe 1
file_val = pd.DataFrame(val,columns=['filename']) # dataframe 1
Dataframe # 2 input :
ghi.Json.gz
abc.Json.gz
cde.Json.gz
mno.Json.gz
xyz.Json.gz
#dataframe 2
rds_rcd = pd.read_sql_query('''SELEct filename from tablename where cast(event_date as datE) = '{0}' '''.format(self.timestr),conn)
Below code to check if there are any common records between both dataframe # 1 and daframe # 2
file_val['status'] = np.where(file_val['filename'].values != rds_rcd['filename'].values,'false','True')
上述两个数据框具有相同的列(文件名),但记录数不同。
问题: 即使两个数据框中都存在“abc.Json.gz”和“cde.Json.gz”,但仍将值视为“false”所有记录。
filename status
0 abc.Json.gz false
1 cde.Json.gz false
任何建议都会很棒。
假设您有 2 个数据帧 df1 和 df2,例如:
df1:
filename
0 abc.json.gz
1 cde.json.gz
2 efg.json.gz
和
df2:
filename
0 ghi.json.gz
1 abc.json.gz
2 cde.json.gz
3 mno.json.gz
4 xyz.json.gz
您可以通过以下方式找到常用的文件名集:
common_files = set(df1['filename'].to_list()).intersection(set(df2['filename'].to_list()))
这产生:
{'abc.json.gz','cde.json.gz'}
以上是大佬教程为你收集整理的比较数据框python中具有相同列的不同行全部内容,希望文章能够帮你解决比较数据框python中具有相同列的不同行所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。