处理多个python脚本的建议
我目前有几个python脚本,我将它们分开保存,因为1)可读性,2)有时我对这些部分单独脚本的输出感兴趣 然而,通常情况下,其中一个脚本的CSV文件输出是下一个脚本的CSV输入,在每个脚本中,我必须重新读取日期时间,这很不方便 对于这项任务,您建议哪些最佳做法?当我对运行整个程序感兴趣时,最好将所有脚本合并成一个脚本,还是有更多的Python/Pandas方法来处理这个问题处理多个python脚本的建议,python,pandas,Python,Pandas,我目前有几个python脚本,我将它们分开保存,因为1)可读性,2)有时我对这些部分单独脚本的输出感兴趣 然而,通常情况下,其中一个脚本的CSV文件输出是下一个脚本的CSV输入,在每个脚本中,我必须重新读取日期时间,这很不方便 对于这项任务,您建议哪些最佳做法?当我对运行整个程序感兴趣时,最好将所有脚本合并成一个脚本,还是有更多的Python/Pandas方法来处理这个问题 谢谢您,我也非常感谢您的评论,您可以使用pandas.DataFrame.to_pickle()和pandas.read_
谢谢您,我也非常感谢您的评论,您可以使用
pandas.DataFrame.to_pickle()
和pandas.read_pickle()
方法,以高效的二进制格式编写和读取pandas.DataFrame
,分别。您可以分别使用pandas.DataFrame.to_pickle()
和pandas.read_pickle()
方法,以有效的二进制格式编写和读取pandas.DataFrame
,而不是编写需要重新解析的CSV输出。如果我理解您的问题,对我来说,使用模块是最好的方法
您可以将脚本分开,并在依赖脚本中需要时将其作为模块导入。例如:
脚本1:
import pandas
def create_pandas_dataframe():
# Creating a dataframe ...
df = pandas.DataFrame()
return df
def run():
# Run the script 1
df = create_pandas_dataframe()
# Here, call other functions specific to this script
if __name__ == '__main__':
# Run the script
run()
脚本2:
from script_1 import create_pandas_dataframe
def use_pandas_dataframe(a_df):
print a_df
if __name__ == '__main__':
df = create_pandas_dataframe()
use_pandas_dataframe(df)
这样,您就可以直接使用现有函数的输出作为另一个函数的输入,而不必使用相同的脚本。如果我理解您的问题,使用模块将是最好的方法 您可以将脚本分开,并在依赖脚本中需要时将其作为模块导入。例如: 脚本1:
import pandas
def create_pandas_dataframe():
# Creating a dataframe ...
df = pandas.DataFrame()
return df
def run():
# Run the script 1
df = create_pandas_dataframe()
# Here, call other functions specific to this script
if __name__ == '__main__':
# Run the script
run()
脚本2:
from script_1 import create_pandas_dataframe
def use_pandas_dataframe(a_df):
print a_df
if __name__ == '__main__':
df = create_pandas_dataframe()
use_pandas_dataframe(df)
通过这种方式,您可以直接使用现有函数的输出作为另一个函数的输入,而不必将它们放在同一个脚本中