从Java网站复制所选文本

从Java网站复制所选文本,java,web,copy,Java,Web,Copy,我想从以下网站复制红色文本。我不想要任何HTML代码,因为我可以得到,但我正在寻找一种方法,简单地复制所有的红色文本。我知道我可以手动完成,但这不是我想要的。我将非常感谢分享任何代码 http://www.srigranth.org/servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0 允许您阅读网页并迭代其内容元素 Sting yourU

我想从以下网站复制红色文本。我不想要任何HTML代码,因为我可以得到,但我正在寻找一种方法,简单地复制所有的红色文本。我知道我可以手动完成,但这不是我想要的。我将非常感谢分享任何代码

http://www.srigranth.org/servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0
允许您阅读网页并迭代其内容元素

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();
我不明白那页上是什么,但看起来你要找的文本可能是
a
dict
链接的内部html。如果是这样的话

Elements links = doc.select("a.dict");
将为您提供一个可编辑的
元素集合
,您可以轻松提取其中的文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}
这是一个基本的想法,你可能需要做一些实验才能“恰到好处”,但Jsoup网站上也有很多例子。

允许你阅读网页并迭代其内容元素

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();
我不明白那页上是什么,但看起来你要找的文本可能是
a
dict
链接的内部html。如果是这样的话

Elements links = doc.select("a.dict");
将为您提供一个可编辑的
元素集合
,您可以轻松提取其中的文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}
这是一个基本的想法,你可能需要做一些实验才能“恰到好处”,但Jsoup网站上也有很多例子。

允许你阅读网页并迭代其内容元素

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();
我不明白那页上是什么,但看起来你要找的文本可能是
a
dict
链接的内部html。如果是这样的话

Elements links = doc.select("a.dict");
将为您提供一个可编辑的
元素集合
,您可以轻松提取其中的文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}
这是一个基本的想法,你可能需要做一些实验才能“恰到好处”,但Jsoup网站上也有很多例子。

允许你阅读网页并迭代其内容元素

Sting yourURL = "servlet/gurbani.gurbani?Action=Page&Param=1&g=1&h=0&r=0&t=0&p=0&k=0&fb=0";
Document doc = Jsoup.connect(yourURL).get();
我不明白那页上是什么,但看起来你要找的文本可能是
a
dict
链接的内部html。如果是这样的话

Elements links = doc.select("a.dict");
将为您提供一个可编辑的
元素集合
,您可以轻松提取其中的文本内容:

for (Element word : links) {
    String theTextyoureafter = word.html();
}

这是一个基本的想法,你可能需要做一些实验才能“恰到好处”,但是Jsoup网站上也有很多例子。

这很好,但是我用每个“单词”来分隔文本,所以我真的不知道新行从哪里开始,从哪里结束。既然你不懂课文,就用这个:任何蓝色的东西都是我想要的。我基本上想把所有这些行添加到我的ArrayList中。但还是要感谢比手工复制更好的东西。对于英文版,文档结构有所不同(每个单词没有
a
元素),但想法保持不变。尝试使用Firebug或Chrome的开发工具来理解页面的结构,但它看起来像是首先查找所有
div
元素,并且在每个div中查找所有
a
元素,就我所能看到的而言,每个句子都被包装成一个div。请阅读手册页面,选择器非常强大!祝你的项目好运。这很好,但我的文本被每个“单词”隔开,所以我真的不知道新行从哪里开始,从哪里结束。既然你不懂课文,就用这个:任何蓝色的东西都是我想要的。我基本上想把所有这些行添加到我的ArrayList中。但还是要感谢比手工复制更好的东西。对于英文版,文档结构有所不同(每个单词没有
a
元素),但想法保持不变。尝试使用Firebug或Chrome的开发工具来理解页面的结构,但它看起来像是首先查找所有
div
元素,并且在每个div中查找所有
a
元素,就我所能看到的而言,每个句子都被包装成一个div。请阅读手册页面,选择器非常强大!祝你的项目好运。这很好,但我的文本被每个“单词”隔开,所以我真的不知道新行从哪里开始,从哪里结束。既然你不懂课文,就用这个:任何蓝色的东西都是我想要的。我基本上想把所有这些行添加到我的ArrayList中。但还是要感谢比手工复制更好的东西。对于英文版,文档结构有所不同(每个单词没有
a
元素),但想法保持不变。尝试使用Firebug或Chrome的开发工具来理解页面的结构,但它看起来像是首先查找所有
div
元素,并且在每个div中查找所有
a
元素,就我所能看到的而言,每个句子都被包装成一个div。请阅读手册页面,选择器非常强大!祝你的项目好运。这很好,但我的文本被每个“单词”隔开,所以我真的不知道新行从哪里开始,从哪里结束。既然你不懂课文,就用这个:任何蓝色的东西都是我想要的。我基本上想把所有这些行添加到我的ArrayList中。但还是要感谢比手工复制更好的东西。对于英文版,文档结构有所不同(每个单词没有
a
元素),但想法保持不变。尝试使用Firebug或Chrome的开发工具来理解页面的结构,但它看起来像是首先查找所有
div
元素,并且在每个div中查找所有
a
元素,就我所能看到的而言,每个句子都被包装成一个div。请阅读手册页面,选择器非常强大!祝你的项目好运。