Python 3.x 通配符可以’;不能在wholetext文件中使用

Python 3.x 通配符可以’;不能在wholetext文件中使用,python-3.x,scala,apache-spark,pyspark,databricks,Python 3.x,Scala,Apache Spark,Pyspark,Databricks,我尝试将文件夹/子文件夹中的XML文件保存为wholeText文件,但当我尝试使用 sc.wholeTextFiles("folder/*/*.xml") 我得到一个错误: llegalArgumentException:'java.net.URISyntaxException:应为 索引中特定于方案的部分 我正在使用databricks确定问题的原因。问题是:导致此问题的文件夹之一中的“:”。。参考github.com/apache/spark/pull/4368'java.net.URIS

我尝试将文件夹/子文件夹中的XML文件保存为wholeText文件,但当我尝试使用

sc.wholeTextFiles("folder/*/*.xml")
我得到一个错误:

llegalArgumentException:'java.net.URISyntaxException:应为 索引中特定于方案的部分


我正在使用databricks

确定问题的原因。问题是:导致此问题的文件夹之一中的“:”。。参考github.com/apache/spark/pull/4368

'java.net.URISyntaxException
-python?scala?在这两种情况下,我在Databricks中得到了相同的错误。错误似乎与路径的模式有关。你的档案在哪里?(hdfs,storage,…?@blackishop,它在dbfsop中,您是否在路径中添加了
dbfs:
?(
sc.wholeTextFiles(“dbfs:/folder/*/*.xml”)