大佬教程收集整理的这篇文章主要介绍了使用函数创建新变量并在 R,大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。
我有一个庞大的马赛租赁房地产市场数据集(名为 @H_927_3@marseilleAnnons),其中包含一些变量:
structure(List(ID = c("af626000-342e-11e8-a56e-8326540c0e87","20629290-c926-11e6-a626-abf6d3bf8a25","8495af50-b92c-11e5-86ef-abf6d3bf8a25","a4299b60-11e3-11ea-9589-c1180fadeaa5","833f81d0-d3da-11ea-b28a-1b6a75606a9a","75358b40-6d76-11e5-bb7a-cfb08fbdec46","8d6f22f3-abc7-11e4-b16a-1100e6029c1e","10ed2580-28cb-11e9-bcd9-d3a30a46a7fe","dd156b70-1534-11e6-afdf-abf6d3bf8a25","15688650-2934-11e8-ab89-41d65c7c6457"),type = c("APARTMENT","APARTMENT","PREMISES","PREMISES"),SURFACE = c(19,29,17,55,35,50,67,30,28,45),ROOM_COUNT = c(1,2,1,3,NA),PRICE = c(295,470,290,610,550,500,655,445,1943),RENTAL_EXPENSES = c(45,NA,40,RENTAL_EXPENSES_INCLUDED = c(TRUE,TRUE,NA)),row.names = c(NA,-10L),class = c("tbl_df","tbl","data.frame"))
在这个数据集中,如果 RENTAL_EXPENSES_INCLUDED=TRUE,变量 PRICE 包含 RENTAL_EXPENSES 中的值,如果 RENTAL_EXPENSES_INCLUDED=falSE,变量 PRICE 不包含 RENTAL_EXPENSES 中的值。我的目标是创建一个新列,其中价格不包含 RENTAL_EXPENSES 中的值,名为 HC。我试图创建一个函数:
for(i in 1:length(marseilleAnnonces$RENTAL_EXPENSES_INCLUDED)){
x = marseilleAnnonces$RENTAL_EXPENSES_INCLUDED[i]
if(x == TRUE){
marseilleAnnonces$HC[i] = PRICE[i]-RENTAL_EXPENSES[i]
}
else {
marseilleAnnonces$HC[i] = PRICE[i]
}
}
R 告诉我有一个需要 TRUE/falSE 的缺失值。也许我的数据集中有很多 NA 的事实是一个问题。 欢迎任何建议是正确的方向。
提前致谢!
编辑:根据您的评论:
@H_748_7@marseillAnnonces %>% mutate(HC = case_when(RENTAL_EXPENSES_INCLUDED == TRUE ~ PRICE - RENTAL_EXPENSES,RENTAL_EXPENSES_INCLUDED == falSE ~ PRICE))
以上是大佬教程为你收集整理的使用函数创建新变量并在 R全部内容,希望文章能够帮你解决使用函数创建新变量并在 R所遇到的程序开发问题。
如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。
本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。