Dataframe 使用静态日期值筛选数据帧
我正在尝试筛选数据帧,以获得所有大于“2012-09-15”的日期 我尝试了另一个建议我使用的帖子中的解决方案Dataframe 使用静态日期值筛选数据帧,dataframe,apache-spark,pyspark,apache-spark-sql,pyspark-sql,Dataframe,Apache Spark,Pyspark,Apache Spark Sql,Pyspark Sql,我正在尝试筛选数据帧,以获得所有大于“2012-09-15”的日期 我尝试了另一个建议我使用的帖子中的解决方案 data.filter(data("date").lt(lit("2015-03-14"))) 但是我犯了个错误 TypeError:“DataFrame”对象不可调用 这个问题的解决方案是什么?您需要用方括号括住“日期”,即 data.filter(数据[“日期”]'2012-09-15'”) data.filter(data["date"] < lit("2015-03-1
data.filter(data("date").lt(lit("2015-03-14")))
但是我犯了个错误
TypeError:“DataFrame”对象不可调用
这个问题的解决方案是什么?您需要用方括号括住“日期”,即
data.filter(数据[“日期”]
调用
data(“date”)
就是将data
视为一个函数(而不是一个数据帧)现在我得到了TypeError:“Column”对象不是可调用的啊,是的,我建议只使用过滤器也可以使用sql表达式。尝试data.filter(“日期>'2012-09-15'”)
data.filter(data["date"] < lit("2015-03-14"))