齐柏林飞艇中的python.sql错误：name错误：name'；pysqldf'；没有定义_Python_Pandas_Apache Zeppelin

齐柏林飞艇中的python.sql错误：name错误：name'；pysqldf'；没有定义

python pandas

齐柏林飞艇中的python.sql错误：name错误：name'；pysqldf'；没有定义,python,pandas,apache-zeppelin,Python,Pandas,Apache Zeppelin,Apache齐柏林飞艇（版本0.9.0-preview1）的新功能。它安装了它，并一直在创建一个新的笔记本电脑。尝试使用python.sql并获取错误：NameError:未定义名称“pysqldf” 第1款： %python # download IMDB files, store in pandas dataframes import pandas as pd import numpy as np dfTitles = pd.read_csv('https://datasets.imdbws

Apache齐柏林飞艇（版本0.9.0-preview1）的新功能。它安装了它，并一直在创建一个新的笔记本电脑。尝试使用python.sql并获取错误：NameError:未定义名称“pysqldf”

第1款：

%python
# download IMDB files, store in pandas dataframes
import pandas as pd
import numpy as np
dfTitles = pd.read_csv('https://datasets.imdbws.com/title.basics.tsv.gz', sep='\t', header=0, compression='gzip', index_col='tconst', usecols=['tconst', 'titleType', 'primaryTitle', 'originalTitle', 'startYear', 'endYear', 'runtimeMinutes', 'genres'], dtype='str')

# clean up and transform data
dfTitles.replace(to_replace={'startYear': r'\N', 'endYear': r'\N', 'runtimeMinutes': r'\N', 'genres': r'\N'}, value={'startYear': '0', 'endYear': '0', 'runtimeMinutes': '0', 'genres': ''}, inplace=True)
dfTitles = dfTitles.astype({'startYear': 'int32', 'endYear': 'int32'})

第2段：

%python.sql
SELECT COUNT(primaryTitle), startYear FROM dfTitles WHERE startYear > ${minYear=1980} AND startYear <= 2020 GROUP BY startYear ORDER BY startYear

但我无法在笔记本上运行这些。如果我需要运行它们，从何处运行它们？

通过让它重新启动齐柏林飞艇服务器修复了该问题

服务器可能已经耗尽了内存，因为我在没有清理内存的情况下创建了一堆数据帧等

我不必运行“pip install”命令

得到了这个结果图表：

pip install pandas
pip install -U pandasql