Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark 如何在Spark filter函数中收集或存储过滤掉的JSON_Apache Spark_Hbase_Hdfs_Spark Streaming - Fatal编程技术网

Apache spark 如何在Spark filter函数中收集或存储过滤掉的JSON

Apache spark 如何在Spark filter函数中收集或存储过滤掉的JSON,apache-spark,hbase,hdfs,spark-streaming,Apache Spark,Hbase,Hdfs,Spark Streaming,我想存储或收集过滤掉的数据,即无法通过hdfs或hbase验证的JSON dstream.filter { data => VitalValidator.isVitalJSONValid(data) } 其中,dstream是dstream[String],而isVitalJSONValid接受String并返回boolean我会用Scala做类似的事情 def isVitalJSONValid(数据:字符串):布尔={ var isValid=false //形成了一些验证 if(da

我想存储或收集过滤掉的数据,即无法通过hdfs或hbase验证的JSON

dstream.filter { data => VitalValidator.isVitalJSONValid(data) }

其中,dstream是dstream[String],而isVitalJSONValid接受String并返回boolean

我会用Scala做类似的事情

def isVitalJSONValid(数据:字符串):布尔={
var isValid=false
//形成了一些验证
if(data.equals(“部分/验证”)){
isValid=true
}
!有效吗
}
//这是怎么回事
dstream.filter(数据=>isVitalJSONValid(数据)).saveAsHadoopFiles(“文件前缀”)

你读过吗?简单地说,我已经读过了,请告诉我这有什么问题?一行代码是不够的。请添加更多源代码,以便更好地分析其他源代码。感谢您的回复Srinivas,但您的代码仅在验证为真时收集数据。此外,我想进一步处理有效数据,并将无效数据存储/收集到hbase或hdfshere collect中。此处collect不起作用,因为它是数据流[String],请检查编辑。您可以根据需要更改
isVitalJSONValid
方法。