程序问答   发布时间:2022-05-31  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

如何解决使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”?

开发过程中遇到使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”的问题如何解决?下面主要结合日常开发的经验,给出你关于使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”的解决方法建议,希望对你解决使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”有所启发或帮助;

我有一个 spark 数据框,其中包含一组定义组的分类列、一个日期列和几个带有数值的列。某些组的日期不跨越整个范围,从 date.min() 到 date.max(),我试图“重新索引”数据框以填补空白。我可以在熊猫中做到这一点,但以下 grouped_map 不起作用:

scheR_645_11845@a_df = input_df.scheR_645_11845@a

@pandas_udf(scheR_645_11845@a_df,PandasUDFType.GROUPED_MAp)
def my_udf(df):
  df = df.sort_values(by='date')
  
  df = df.set_index('date')
  df = df.asfreq('D')
  df = df.reset_index(level='date')

  return df

output_df = input_df.groupby('cat_col_a','cat_col_B').apply(my_udf)

如标题中所述,结果 spark 失败并出现“java.lang.NullPointerException”错误 - 原始数据帧没有缺失值,无论如何架构具有可为空的列。此外,在 Pandas 数据帧样本(通过 topandas() 获得)上执行普通函数会返回预期结果。关于可能导致此问题的原因有什么想法吗?

预先感谢您的帮助!

解决方法

暂无找到可以解决该程序问题的有效方法,小编努力寻找整理中!

如果你已经找到好的解决方法,欢迎将解决方案带上本链接一起发送给小编。

小编邮箱:dio#foxmail.com (将#修改为@)

大佬总结

以上是大佬教程为你收集整理的使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”全部内容,希望文章能够帮你解决使用 Pandas UDF 重新索引日期会导致“java.lang.NullPointerException”所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。
标签:使用