Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/283.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
在Python中存储命令行的结果以进行进一步的数据分析_Python_Numpy_Data Analysis - Fatal编程技术网

在Python中存储命令行的结果以进行进一步的数据分析

在Python中存储命令行的结果以进行进一步的数据分析,python,numpy,data-analysis,Python,Numpy,Data Analysis,我将构建一个脚本,它将提取PDF文件的某些特性。每个文件的提取输出如下: obj 8 endobj 8 stream 1 endstream 1 xref 1 trailer 1 startxref 1 /Page 1 /Enc

我将构建一个脚本,它将提取PDF文件的某些特性。每个文件的提取输出如下:

 obj                    8
 endobj                 8
 stream                 1
 endstream              1
 xref                   1
 trailer                1
 startxref              1
 /Page                  1
 /Encrypt               0
现在我需要为超过1000个文件创建此结果的数据集。 我的最终数据集应该在这里存储每个实体的数值。 例如:

一旦我有了这些数据,我计划运行一些统计数据,比如Obj的平均值是多少等等。记住这些,最理想的方法应该是什么。 我计划创建一个表,其中实体将成为行,值将成为列。 我还遇到了
numpy
,因为我的工作主要是数据分析,但我不确定它是否适合这种情况。
请分享你的建议

我使用python
dict
解决了这个问题。对我来说非常有效

你打算使用多维数组和线性代数吗?如果不是的话,
numpy
可能不会特别有用<代码>熊猫可能有用。或者你可能只需要一个
口述
。然而,这个问题似乎过于宽泛\
obj: 8,6,5,2,8,9
endobj:8,5,4,1,1,2,3
...
..
...