Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/csharp/330.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
C# 提取大量PDF文件的最佳方法?_C#_Sql_Performance_Ssis_7zip - Fatal编程技术网

C# 提取大量PDF文件的最佳方法?

C# 提取大量PDF文件的最佳方法?,c#,sql,performance,ssis,7zip,C#,Sql,Performance,Ssis,7zip,我正在尝试改进自动工作流背后的性能,该工作流提取了几个zip文件(10到15个),每个文件包含大约5000个PDF文件 我的问题是:如果我想将所有这些zip文件快速解压缩到一个目录中,您推荐的最佳方法是什么?如果我想先归档这些文件,然后将输出复制到单独的目录进行后期处理,该怎么办 我最初的想法是通过7za.exe(7-zip)并行运行每个zip文件,这是我过去手动完成的。然而,它仍然非常缓慢,可能需要两个小时。无论是一次运行一个提取过程,还是一次运行所有提取过程,都不会影响性能 我将用C#和T-

我正在尝试改进自动工作流背后的性能,该工作流提取了几个zip文件(10到15个),每个文件包含大约5000个PDF文件

我的问题是:如果我想将所有这些zip文件快速解压缩到一个目录中,您推荐的最佳方法是什么?如果我想先归档这些文件,然后将输出复制到单独的目录进行后期处理,该怎么办

我最初的想法是通过7za.exe(7-zip)并行运行每个zip文件,这是我过去手动完成的。然而,它仍然非常缓慢,可能需要两个小时。无论是一次运行一个提取过程,还是一次运行所有提取过程,都不会影响性能

我将用C#和T-SQL重新创建此工作流我们的目标是在数据到达我们的数据库之前,将SSI从图片中删除,以获得更好的输入验证和逻辑。下面是当前自动化的zip提取部分的屏幕截图


非常感谢您的任何建议或帮助。谢谢你

在快速的谷歌搜索之后,我在这里发现了一大堆关于如何加速文件解压缩的问题。试着看一看和@digital.aron Yea,我在写这篇文章之前看了这些链接。不幸的是,它们不是我想要的。一个断开了指向引用的博客链接,另一个是我当前正在运行的工作流过程。谢谢你!你试过pigz吗?有一个Windows端口可用:@digital.亚伦我没有。我要试一试。非常感谢。