java—从文件中提取公司/出版商/供应商信息的快速方法
我正在从我的java—从文件中提取公司/出版商/供应商信息的快速方法,java,file,metadata,mime-types,Java,File,Metadata,Mime Types,我正在从我的本地文件系统抓取文件和目录,并尝试根据文件的公司/出版商/供应商名称筛选出文件。让我们假设,我想筛选属于Microsoft Corporation的所有文件。我想知道我是否可以从java.nio.file或java.io.file或使用apachetika从MIME\u TYPE获取这些信息,但我没有找到任何快速的方法从这些文件中获取公司/出版商/供应商的信息 我找到了完全符合我要求的,但它减慢了整个过程,因此我正在寻找一种快速方法来提取公司/出版商/供应商详细信息 你能不能把工作负
本地文件系统抓取文件和目录,并尝试根据文件的公司/出版商/供应商
名称筛选出文件。让我们假设,我想筛选属于Microsoft Corporation
的所有文件。我想知道我是否可以从java.nio.file
或java.io.file
或使用apachetika
从MIME\u TYPE
获取这些信息,但我没有找到任何快速的方法从这些文件中获取公司/出版商/供应商的信息
我找到了完全符合我要求的,但它减慢了整个过程,因此我正在寻找一种快速方法来提取公司/出版商/供应商
详细信息 你能不能把工作负载分成多个线程?你能提供一个具体的例子吗?您希望在什么类型的文件上执行此操作?假设我正在对整个c目录进行爬网,即file:///C:/
而且会有许多属于Microsoft的文件,因此我想跳过那些属于Microsoft的文件。,我知道userDefinedFIleAttribute完全满足您的要求。您能否将工作负载拆分为多个线程?您能否提供一个具体的示例?您希望在什么类型的文件上执行此操作?假设我正在对整个c目录进行爬网,即file:///C:/
而且会有许多属于Microsoft的文件,因此我想跳过那些属于Microsoft的文件。我的用户定义文件属性完全满足您的要求。