Python 无法在pyspark中导入csv

Python 无法在pyspark中导入csv,python,apache-spark,pyspark,Python,Apache Spark,Pyspark,我正在尝试将csv导入数据帧,但无法做到这一点。这是代码 csv_2_df = spark.read.csv("home/jovyan/oneDay.csv").option("inferSchema","true").option("mode", "DROPMALFORMED") 当我尝试运行上面的代码时,我得到以下错误 'Path does not exist: file:/home/jovyan/oneDay.csv;' 为了在这里设置上下文,我尝试在jupyter docker文件

我正在尝试将csv导入数据帧,但无法做到这一点。这是代码

csv_2_df = spark.read.csv("home/jovyan/oneDay.csv").option("inferSchema","true").option("mode", "DROPMALFORMED")
当我尝试运行上面的代码时,我得到以下错误

 'Path does not exist: file:/home/jovyan/oneDay.csv;'
为了在这里设置上下文,我尝试在jupyter docker文件中进行设置,其中根目录设置为/home/jovyan/并且我已经上传了我的csv文件。我在这里要做的就是加载csv,我可以使用textfile API来完成

data = sc.textFile('/home/jovyan/oneDay.csv') 

但我尝试使用CSVAPI,因为它提供了删除格式错误行的选项。谢谢你的帮助

正如@cronoik所评论的,尝试在路径中添加正斜杠:

csv_2_df = spark.read.csv("/home/jovyan/oneDay.csv").option("inferSchema","true").option("mode", "DROPMALFORMED")

第一条路径缺少前导的
/
。您也可以尝试
file:///home/jovyan/oneDay.csv
(如果默认值更改为其他值)。