Apache spark 为什么Arango Spark加载数据严格要求预定义的POJO?

Apache spark 为什么Arango Spark加载数据严格要求预定义的POJO?,apache-spark,apache-spark-sql,arangodb,Apache Spark,Apache Spark Sql,Arangodb,用例: 我想加载Arango集合,该集合可以提前推断数据模式,而无需使用Spark Arango指定POJO类。可能吗?如果是,你能解释一下怎么做吗 我从ArangoDB-GraphCourse_初学者pdf中获取了数据模型,可从Arango网站获得。机场是一个令人眩晕的地方。飞行是一种优势。因此,基本上,机场与机场之间的联系是通过飞行优势来实现的 想让所有机场都直接重新安装吗 从洛杉矶来的 阿兰戈查询:- 对于出境“机场/洛杉矶国际机场”航班中的机场 返回机场 方法:- Arangodb火花模

用例:

我想加载Arango集合,该集合可以提前推断数据模式,而无需使用Spark Arango指定POJO类。可能吗?如果是,你能解释一下怎么做吗

我从ArangoDB-GraphCourse_初学者pdf中获取了数据模型,可从Arango网站获得。机场是一个令人眩晕的地方。飞行是一种优势。因此,基本上,机场与机场之间的联系是通过飞行优势来实现的

想让所有机场都直接重新安装吗 从洛杉矶来的

阿兰戈查询:-

对于出境“机场/洛杉矶国际机场”航班中的机场 返回机场

方法:- Arangodb火花模块,我用过。由于没有对AQL的直接支持,所以我使用spark arango连接器加载了这两个集合。现在在加载时,我需要提前提供POJO类。 ArangoJavaRDD airportDataset=ArangoSpark.loadjavaSparkContext,AirportCollection,Airport.class

同样,我加载了flight collection。 在这里,我必须提前创建POJO级机场和航班。 然后 已创建spark createOrReplaceTempView。 现在我已经在这些临时视图上应用了SQL查询来检索这个结果。 SQL:- 选择不同的a.*from airportsTemp a where a.documentHandle in Select b.\u to from flightTemp b where b.\u from='airport/LAX'

我能够通过这种方法实现解决方案

问题:-
对于我的用例,除了ArangoJavaRDD的POJO类之外,还有其他选择吗?要基于自动scheama推断实现这一点吗?

告诉我们您已经开始做什么,这将帮助我们帮助您。@jgp,我已经编辑了我的问题。你能给我引路吗?