Cygwin 通过tika-app-X.Y.jar输出TikaBatch
我正在尝试使用(在cygwin中)提取“输入”中存在的一组文档(.pdf、.doc等)的文本Cygwin 通过tika-app-X.Y.jar输出TikaBatch,cygwin,text-processing,apache-tika,text-parsing,tika-server,Cygwin,Text Processing,Apache Tika,Text Parsing,Tika Server,我正在尝试使用(在cygwin中)提取“输入”中存在的一组文档(.pdf、.doc等)的文本 原因声明为“正常完成”,但我在输出文件夹中看不到任何文件。我没有具体说明什么?@NicomedesE。输入文件夹中存在的所有文档是否都被解析并显示在输出文件夹中?这在我的案子里似乎没有发生,重新检查!这个命令对我也有用!我想我把文件夹的路径弄乱了。@NicomedesE。我在R脚本中使用了这个命令和系统命令,并注意到它突然停止,原因终止为“USER_INTERRUPTION”,只有几个文件被解析(我有大
原因声明为“正常完成”,但我在输出文件夹中看不到任何文件。我没有具体说明什么?@NicomedesE。输入文件夹中存在的所有文档是否都被解析并显示在输出文件夹中?这在我的案子里似乎没有发生,重新检查!这个命令对我也有用!我想我把文件夹的路径弄乱了。@NicomedesE。我在R脚本中使用了这个命令和系统命令,并注意到它突然停止,原因终止为“USER_INTERRUPTION”,只有几个文件被解析(我有大约20个)。当我重新运行脚本时,该命令将解析更多的文件。要解析所有文件,我必须运行命令几次而不是一次。你知道怎么解决这个问题吗?
java -jar tika-app-1.14.jar -t -i /Inputfolder -o /Outputfolder