NLP人工生成字幕

NLP人工生成字幕,nlp,artificial-intelligence,wikipedia,Nlp,Artificial Intelligence,Wikipedia,我需要高质量的人工字幕。如何查询维基百科存储的标题。示例返回包含单词helphier的所有标题。您不能查询Wikipedia标题,当然,您可以通过屏幕抓取它们。Wikimedia Commons有一些机器可读的标题,尽管它正在向更结构化的数据格式过渡,但转储文件还不可用,请参见,因此使用这些标题可能不会有任何好处 如果您不需要大量数据,您可以查看Commons的当天图片,其中的标题存储在一个单独的页面上,具有可预测的名称,模板:Potd/yyy-MM-DD\LL例如。不过,您仍然需要进行一些轻量

我需要高质量的人工字幕。如何查询维基百科存储的标题。示例返回包含单词helphier的所有标题。您不能查询Wikipedia标题,当然,您可以通过屏幕抓取它们。Wikimedia Commons有一些机器可读的标题,尽管它正在向更结构化的数据格式过渡,但转储文件还不可用,请参见,因此使用这些标题可能不会有任何好处


如果您不需要大量数据,您可以查看Commons的当天图片,其中的标题存储在一个单独的页面上,具有可预测的名称,模板:Potd/yyy-MM-DD\LL例如。不过,您仍然需要进行一些轻量级的wikitext或HTML解析。

请添加到目前为止您尝试过的内容的更多详细信息。包括,代码和程序。你抓到维基百科页面了吗?欢迎来到堆栈溢出。请通过本教程了解堆栈溢出的工作原理,并阅读如何提高问题的质量。然后编辑你的问题,将你的源代码作为一个例子,其他人可以编译和测试。也可以查看,看看你可以问什么问题。Nikhil…我不知道从哪里开始…查询字幕…我需要数据,人工生成的字幕。你知道我如何查询wikicommons标题吗?你查询标题是什么意思?你的意思是想从维基百科/维基共享网页中提取与标题相关的文本吗?我需要人工生成的标题。因此,我想提取尽可能多的人工生成的标题,其中包含直升机这个词。我假设wiki有大量的图片,但我对图片不感兴趣,但对标题感兴趣。所以我想从维基百科下载所有包含Helicopter这个词的标题谢谢这是一个开始