Java 如何从上传的PDF、Doc、Xls、Csv等文件中计算单词、字符或句子
如何使用PHP、Zend Framework或基于CLI的Java触发器从PDF、Doc、Xls、Csv等格式的上传文件中计算单词数?这里有一个第三方应用程序。您可以为它创建一个简单的包装器。就wc而言,这些文件类型并不准确。请看首先,您应该看看 它是用Java编写的,是免费的(Apache许可),可以将您提到的所有格式转换为文本。在那之后,字数应该是微不足道的 您还可以使用linux命令行实用程序转换为文本,并围绕它们编写一个简单的包装器 (由于缺乏声誉,我无法链接到这些。请使用您的Google fu。)Java 如何从上传的PDF、Doc、Xls、Csv等文件中计算单词、字符或句子,java,php,zend-framework,Java,Php,Zend Framework,如何使用PHP、Zend Framework或基于CLI的Java触发器从PDF、Doc、Xls、Csv等格式的上传文件中计算单词数?这里有一个第三方应用程序。您可以为它创建一个简单的包装器。就wc而言,这些文件类型并不准确。请看首先,您应该看看 它是用Java编写的,是免费的(Apache许可),可以将您提到的所有格式转换为文本。在那之后,字数应该是微不足道的 您还可以使用linux命令行实用程序转换为文本,并围绕它们编写一个简单的包装器 (由于缺乏声誉,我无法链接到这些。请使用您的Googl
- pdf:pdftotext(xpdf的一部分)。另请参见关于超级用户的问题#221359
- 文档(x):abiword、catdoc、antiword、DocXtoText。。。另请参见关于超级用户的问题165978
- xls(以及几乎所有内容,但需要OpenOffice):