Hadoop 如何使用Jena从HDFS读取文件并将其转换为Rdf?
我正在使用ApacheJena将.csv文件转换为.rdf。我使用Hadoop 如何使用Jena从HDFS读取文件并将其转换为Rdf?,hadoop,rdf,jena,Hadoop,Rdf,Jena,我正在使用ApacheJena将.csv文件转换为.rdf。我使用model.read(pathFile),但它只从本地文件系统读取文件。我想从hdfs读取,比如model.read(hdfs://....),但它给出了一个错误 错误是: 线程“main”org.apache.jena.riot.RiotNotFoundException中的异常:未找到:hdfs://localhost:54310/user/hduser/demo/departments/part-00000.csv 我怎么
model.read(pathFile)
,但它只从本地文件系统读取文件。我想从hdfs读取,比如model.read(hdfs://....)
,但它给出了一个错误
错误是:
线程“main”org.apache.jena.riot.RiotNotFoundException中的异常:未找到:hdfs://localhost:54310/user/hduser/demo/departments/part-00000.csv
我怎么做 您需要将
定位器添加到StreamManager
以处理“hdfs://”
Jena没有提供读取HDFS URL的代码。您能告诉我们您的代码以及您遇到的错误吗?@vefthym我在下面添加了我的代码。请用这些详细信息编辑您的问题。不要添加不是答案的答案。现在,我是为你做的。以后请遵循此练习。谢谢您的回答。但是我有一个问题,你能用Spark来运行ConverDept()方法来加速执行吗?