Python 熊猫是当地唯一的图书馆吗

Python 熊猫是当地唯一的图书馆吗,python,pandas,Python,Pandas,我最近开始编写代码,但花了一段时间。我开始了一份新工作,我受到一些保密限制。在我做这件事之前,我需要确保python和pandas是安全的——我也将在周一与它交谈 我想知道python中的pandas是本地库,还是数据被发送到其他地方?如果我在pandas中写一些东西,数据会存储在pandas下的某个地方吗 我正在做的最好的例子可以在一篇关于从没有csv导出的表中剥离数据的中型文章中找到 用dict创建一个数据帧,对其行执行矢量化操作,打印数据片段等都是完全本地的。我不知道为什么这很重要。您的I

我最近开始编写代码,但花了一段时间。我开始了一份新工作,我受到一些保密限制。在我做这件事之前,我需要确保python和pandas是安全的——我也将在周一与它交谈

我想知道python中的pandas是本地库,还是数据被发送到其他地方?如果我在pandas中写一些东西,数据会存储在pandas下的某个地方吗

我正在做的最好的例子可以在一篇关于从没有csv导出的表中剥离数据的中型文章中找到


用dict创建一个
数据帧
,对其行执行矢量化操作,打印数据片段等都是完全本地的。我不知道为什么这很重要。您的IT部门是否会说,“嗯,这看起来可疑,但互联网上的一些随机家伙说这是安全的,所以忘记我们的政策,我们会允许的”?但是,值得一提的是,你有一个随机的家伙在互联网上说它是安全的

但是,熊猫可以用来发出网络请求。其中一些可以采用URL,而不是文件名或文件对象。他们中的一些人还可以使用另一个这样做的库,例如,如果您安装了
lxml
,则会将文件名传递到
lxml
以打开,如果该文件名是HTTP URL,则
lxml
将获取它

这很少是一个问题,但如果你想变得偏执,你可以想象它可能的方式

例如,假设您的程序正在解析用户提供的CSV文件并对其进行一些数据处理。那是安全的;根本没有网络接入

现在,您为用户添加了一种通过URL指定CSV文件的方法,并将它们传递到
read\u CSV
中并获取它们。仍然安全;有网络接入,但对最终用户来说是透明的,显然是用户任务所需要的;如果这不合适,您的公司不会要求您添加此功能

现在,您为CSV文件添加了一种引用其他CSV文件的方法:如果列1是
@path/to/other/file
,则递归读取和解析
path/to/other/file
,并将其嵌入到当前行的位置。现在,如果我能给你的一个用户一个CSV文件,在69105行,有
@http://example.com/evilendpoint?track=me
(一个端点,它做了一些不好的事情,但返回了一些看起来非常有效的东西,可以在CSV的第69105行插入)?现在你可能在协助我对你的员工进行黑客攻击,甚至都没有意识到这一点

当然,这是一个更为有限的版本,它的功能与每个带有HTML页面的web浏览器完全相同。但是,也许您的IT部门变得偏执,限制了浏览器的安全性,并编写了一个应用程序级嗅探器来检测来自HTML的可疑后续请求,并且没有想过对CSV文件中的引用执行同样的操作


我认为这不是一个理智的IT部门应该担心的问题。如果你的公司不相信你会考虑这些问题,他们就不应该雇佣你,并指派你编写涉及网络的软件。但是,并不是每个IT部门都对自己的工作神智清醒,不会产生偏执。(“当然,我们可以将这个1024以下的端口转发给您的笔记本电脑…但您最好不要安装比16.0更新的Firefox版本…”

您是否尝试禁用网络并运行pandas?你会马上知道答案的。谢谢阿巴内特-他们没有让我写程序。我只知道理论上我会怎么做,但这是很多可以避免的手动输入。