Machine learning 如何从非结构化文本(pdf、txt、html)构建语料库并培训IBM Watson?然后通过API调用提问?

Machine learning 如何从非结构化文本(pdf、txt、html)构建语料库并培训IBM Watson?然后通过API调用提问?,machine-learning,ibm-watson,Machine Learning,Ibm Watson,我想使用一些PDF、txt、html非结构化数据来训练一个机器学习系统,比如IBMWatson,然后通过API调用提问并获得答案。我怎样才能做到这一点?基于GUI的培训或基于API的培训。从Bluemix中,很难决定哪种服务最适合实现这一需求。您能推荐最佳选项吗?检索和排名-检索和排名可以显示文档集合中最相关的信息。例如,使用R&R,经验丰富的技术人员可以从密集的产品手册中快速找到解决方案。呼叫中心代理还可以快速找到答案,以缩短平均呼叫处理时间。检索和排名服务是开箱即用的,但也可以定制以改进结果

我想使用一些PDF、txt、html非结构化数据来训练一个机器学习系统,比如IBMWatson,然后通过API调用提问并获得答案。我怎样才能做到这一点?基于GUI的培训或基于API的培训。从Bluemix中,很难决定哪种服务最适合实现这一需求。您能推荐最佳选项吗?

检索和排名-检索和排名可以显示文档集合中最相关的信息。例如,使用R&R,经验丰富的技术人员可以从密集的产品手册中快速找到解决方案。呼叫中心代理还可以快速找到答案,以缩短平均呼叫处理时间。检索和排名服务是开箱即用的,但也可以定制以改进结果。更多细节


发现服务—通过转换、规范化和丰富非结构化数据,从中提取价值。使用一种简化的查询语言来浏览该数据,或快速访问预丰富的数据集,如Discovery News collection。更多详细信息

出于您的目的,我推荐Watson Discovery。 它非常完整,支持GUI和API中的许多功能。它支持自然语言或查询格式的问题

其文件如下:

如果您创建了Watson Discovery的免费实例,您可以在此处测试其API:

这里有每个API调用的示例:

这里还有一个演示和相应的代码: 和