Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/google-app-engine/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Java HTML解析和映射_Java_Javascript_Html - Fatal编程技术网

Java HTML解析和映射

Java HTML解析和映射,java,javascript,html,Java,Javascript,Html,我打算构建一些类似翻译的web应用程序,其中用户查看html页面(我从web收集并离线存储在服务器端),然后用户需要通过选择字符子集(要求类似翻译的操作)与此html中的文本进行交互 因此,这里的过程分为3个部分: -从html文件中提取纯文本 -纯文本将在服务器上预处理并脱机存储 -当用户在线选择html中的字符串时,我需要在已脱机提取和存储的纯文本中标识映射 对于纯文本提取,我使用jsoup。 我已经预处理了普通文件。。 关于映射部分和识别用户选择(或单击)的文本有什么想法吗 [在Java

我打算构建一些类似翻译的web应用程序,其中用户查看html页面(我从web收集并离线存储在服务器端),然后用户需要通过选择字符子集(要求类似翻译的操作)与此html中的文本进行交互

因此,这里的过程分为3个部分:
-从html文件中提取纯文本
-纯文本将在服务器上预处理并脱机存储
-当用户在线选择html中的字符串时,我需要在已脱机提取和存储的纯文本中标识映射

对于纯文本提取,我使用jsoup。
我已经预处理了普通文件。。
关于映射部分和识别用户选择(或单击)的文本有什么想法吗

[在Java、ApacheTomcat、JavaScript和linux上工作]

你想映射什么?HTMLtext、文本翻译、HTMLtranslation、所选HTMLselected text、。。。?