CSV格式数据操作:为什么使用python脚本而不是MS excel函数?

CSV格式数据操作:为什么使用python脚本而不是MS excel函数?,python,excel,csv,Python,Excel,Csv,我目前正在处理csv格式的大型数据集。在某些情况下,使用excel函数完成工作会更快。但是,我想编写python脚本来读/写csv并执行所需的功能。在什么情况下,python脚本比使用excel函数进行数据操作任务更好?长期优势是什么?学习python后,您的灵活性会更高。您可以使用的操作 在MS excel的用户界面上有限制,但没有限制 如果您使用python 好处还在于,您可以自动进行修改,例如,您可以重复使用 或者将其重新应用到其他数据集。速度在很大程度上取决于速度 你使用的算法和库,以及

我目前正在处理csv格式的大型数据集。在某些情况下,使用excel函数完成工作会更快。但是,我想编写python脚本来读/写csv并执行所需的功能。在什么情况下,python脚本比使用excel函数进行数据操作任务更好?长期优势是什么?

学习python后,您的灵活性会更高。您可以使用的操作 在MS excel的用户界面上有限制,但没有限制 如果您使用python

好处还在于,您可以自动进行修改,例如,您可以重复使用 或者将其重新应用到其他数据集。速度在很大程度上取决于速度 你使用的算法和库,以及关于操作

您也可以在excel中使用VB脚本/宏来自动化操作,但是
通常,python不那么麻烦,也更灵活。

建议在以下情况下使用python:

  • 重复操作:对类似的数据集重复执行类似的操作集。例如,假设你得到一个月的预测数据,你必须执行各种切片、切割和绘图。这里的数据结构和分析步骤大致相同,但每个月的数据不同。使用Python和Pandas将节省大量时间,还可以减少手动错误
  • 探索性分析:一旦您对Pandas、Numpy和Matplotlib有了一定的了解,使用这些python库进行分析比Excel分析更快、更高效。一个简单的用例就是回溯。使用Pandas,您可以快速追溯并恢复数据集的原始形式或早期分析形式。使用Excel,您可能会在迷宫般的分析之后迷失方向,并且可能会在cntrl+z之外的早期形式中迷失方向
  • 教学工具:在我看来,这是最未充分利用的功能。IPython笔记本可能是数据分析的优秀教学工具和参考文件。使用此功能,您可以在同事之间高效地传递知识,而无需共享复杂的excel文件

  • 这与excel与python无关。它是关于何时使用excel以及何时使用python以提高效率。在我下面的回复中,我列出了某些场景,其中使用Python比使用excel更有效。