Pandas 在Jupyter中编写SQL查询的最佳实践

Pandas 在Jupyter中编写SQL查询的最佳实践,pandas,jupyter-notebook,Pandas,Jupyter Notebook,我正在用Jupyter笔记本做一些分析。我通常使用pandas.read\u sql()在Jupyter中编写sql查询。最近,我编写了一个具有多个连接的相对较大的查询。这是一个25行的查询。用Jupyter编写此类查询时的最佳实践是什么?例如,编写这样的查询没有什么大不了的- pd.read_sql('select cs1.CLIENT as ClientName from central cs1', db.connect_win()) 它很容易阅读和理解,但是更大的查询呢?我希望它们有缩进

我正在用Jupyter笔记本做一些分析。我通常使用
pandas.read\u sql()
在Jupyter中编写sql查询。最近,我编写了一个具有多个连接的相对较大的查询。这是一个25行的查询。用Jupyter编写此类查询时的最佳实践是什么?例如,编写这样的查询没有什么大不了的-

pd.read_sql('select cs1.CLIENT as ClientName from central cs1', db.connect_win())

它很容易阅读和理解,但是更大的查询呢?我希望它们有缩进之类的,这样它们更容易阅读和理解。

我会这样做

sql_query = """
  SELECT first_name, last_name
  FROM actor
  WHERE actor_id IN
  (
    SELECT actor_id
    FROM film_actor
    WHERE film_id IN
    (
      SELECT film_id
      FROM film
      WHERE title = 'ALTER VICTORY'
    )
  );
"""
actor = pd.read_sql(sql_query, db.connect_win())
有一些很棒的VS代码扩展,比如SQLServer(mssql)。它将为您自动设置格式。有时我喜欢先使用VS代码,作为一个linting工具,然后将结果查询粘贴回我的Jupyter笔记本