Warning: file_get_contents(/data/phpspider/zhask/data//catemap/0/amazon-s3/2.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
.NET api来提取不同文件类型的文件内容_.net_File - Fatal编程技术网

.NET api来提取不同文件类型的文件内容

.NET api来提取不同文件类型的文件内容,.net,file,.net,File,我正试图为我的主要项目制作一个电子发现软件。任何人都可以建议使用开源api来提取文件内容并保存为其他格式或数据库。我正在考虑从不同的文件中进行挖掘,并将它们保存到我自己的格式或数据库中。文件类型包括所有办公室类型的文件、电子邮件、pdf。类似于“Stellent”的东西会很好,但它是开源的。请告诉我,我找不到任何好的api。Apache Tika有一个.Net包装程序- 这将从大量文件类型中提取文本。我可以用它转换任何文件类型并保存到数据库吗?您的问题没有涉及转换或数据库。您需要文件属性,这个类

我正试图为我的主要项目制作一个电子发现软件。任何人都可以建议使用开源api来提取文件内容并保存为其他格式或数据库。我正在考虑从不同的文件中进行挖掘,并将它们保存到我自己的格式或数据库中。文件类型包括所有办公室类型的文件、电子邮件、pdf。类似于“Stellent”的东西会很好,但它是开源的。请告诉我,我找不到任何好的api。

Apache Tika有一个.Net包装程序-


这将从大量文件类型中提取文本。

我可以用它转换任何文件类型并保存到数据库吗?您的问题没有涉及转换或数据库。您需要文件属性,这个类提供了(上次修改时间等)。看,很抱歉。现在您可以帮忙了。如果您想从这些文件类型中提取文本,您可以使用