Java 如何从维基百科获取特定文本?

Java 如何从维基百科获取特定文本?,java,android,Java,Android,以此为例: 在“修正案”部分,我想得到每个要点所说的内容,并将它们显示在android应用程序的一个漂亮列表中。我知道有一个维基媒体api,但我完全不知道如何使用它,从我对它的理解来看,你可以在一个部分下获得文本,但我不确定你是否可以分别获得每个要点 最好的方法是什么?或者,我应该花时间将300多页的文本复制到一个文本文件中,并在应用程序中读取它吗?我相信您已经想到了这一点: 如果您的目标是在应用程序中查看Wiki,则可以使用WebView 如果您的目标是捕获特定的数据元素,则可以下载htm

以此为例:

在“修正案”部分,我想得到每个要点所说的内容,并将它们显示在android应用程序的一个漂亮列表中。我知道有一个维基媒体api,但我完全不知道如何使用它,从我对它的理解来看,你可以在一个部分下获得文本,但我不确定你是否可以分别获得每个要点


最好的方法是什么?或者,我应该花时间将300多页的文本复制到一个文本文件中,并在应用程序中读取它吗?

我相信您已经想到了这一点:

  • 如果您的目标是在应用程序中查看Wiki,则可以使用WebView
  • 如果您的目标是捕获特定的数据元素,则可以下载html页面并对其进行字符串处理(div>>ol/ul>>li)

我相信您已经想到了这一点:

  • 如果您的目标是在应用程序中查看Wiki,则可以使用WebView
  • 如果您的目标是捕获特定的数据元素,则可以下载html页面并对其进行字符串处理(div>>ol/ul>>li)

此链接使用mediawiki API从您的问题()中查询页面:

如您所见,它返回一个xml文档,页面文本位于
标记下。它是mediawiki文本标记语言中的纯编辑器文本


因此,要从文本中提取信息,您应该使用解析,有些是用Java编写的。

此链接使用mediawiki API从您的问题()中查询页面:

如您所见,它返回一个xml文档,页面文本位于
标记下。它是mediawiki文本标记语言中的纯编辑器文本


因此,要从文本中提取信息,您应该使用解析,有些是用Java编写的。

复制要点似乎是一种有效的策略。但是你说的这300页在哪里?您只链接到一个。你指的是页面的翻译吗?仅仅复制要点似乎是一种有效的策略。但是你说的这300页在哪里?您只链接到一个。你指的是这页的翻译吗?
http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&titles=United_States_Bill_of_Rights