Python PYSPARK SQL ODBC连接

Python PYSPARK SQL ODBC连接,python,pyspark,apache-spark-sql,odbc,pyodbc,Python,Pyspark,Apache Spark Sql,Odbc,Pyodbc,我已经有一个从python到SQL server的ODBC连接,我希望使用pyspark来运行查询,如何使用pyspark的当前连接 谢谢你的问题很宽泛,但还是来了。 您可以使用以下命令从SQL数据库中读取: 从pyspark.sql导入SparkSession spark=SparkSession.builder.getOrCreate() df=( spark.read.format(“jdbc”) .option(“url”,f“jdbc:{sql\u}://{ip}:{port};dat

我已经有一个从python到SQL server的ODBC连接,我希望使用pyspark来运行查询,如何使用pyspark的当前连接


谢谢

你的问题很宽泛,但还是来了。 您可以使用以下命令从SQL数据库中读取:

从pyspark.sql导入SparkSession
spark=SparkSession.builder.getOrCreate()
df=(
spark.read.format(“jdbc”)
.option(“url”,f“jdbc:{sql\u}://{ip}:{port};databaseName={database}”)
.选项(“数据库表”、“表名称”)
.选项(“用户”,用户名)
.选项(“密码”,密码)
.option(“驱动程序”、“com.microsoft.sqlserver.jdbc.SQLServerDriver”)
.load()
)

我认为重要的一点是使用
JDBC
格式,但要指定
驱动程序。如果您遇到这个问题,您可能需要下载特定的驱动程序/JAR。希望这有帮助。请尝试包含一段代码片段或下次尝试的示例。

您的问题很广泛,但这里是答案。 您可以使用以下命令从SQL数据库中读取:

从pyspark.sql导入SparkSession
spark=SparkSession.builder.getOrCreate()
df=(
spark.read.format(“jdbc”)
.option(“url”,f“jdbc:{sql\u}://{ip}:{port};databaseName={database}”)
.选项(“数据库表”、“表名称”)
.选项(“用户”,用户名)
.选项(“密码”,密码)
.option(“驱动程序”、“com.microsoft.sqlserver.jdbc.SQLServerDriver”)
.load()
)
我认为重要的一点是使用
JDBC
格式,但要指定
驱动程序。如果您遇到这个问题,您可能需要下载特定的驱动程序/JAR。希望这有帮助。请尝试包含您下次尝试的代码片段或示例