Machine learning 如何从非结构化文本（pdf、txt、html）构建语料库并培训IBM Watson？然后通过API调用提问？_Machine Learning_Ibm Watson

Machine learning 如何从非结构化文本（pdf、txt、html）构建语料库并培训IBM Watson？然后通过API调用提问？

machine-learning

Machine learning 如何从非结构化文本（pdf、txt、html）构建语料库并培训IBM Watson？然后通过API调用提问？,machine-learning,ibm-watson,Machine Learning,Ibm Watson,我想使用一些PDF、txt、html非结构化数据来训练一个机器学习系统，比如IBMWatson，然后通过API调用提问并获得答案。我怎样才能做到这一点？基于GUI的培训或基于API的培训。从Bluemix中，很难决定哪种服务最适合实现这一需求。您能推荐最佳选项吗？检索和排名-检索和排名可以显示文档集合中最相关的信息。例如，使用R&R，经验丰富的技术人员可以从密集的产品手册中快速找到解决方案。呼叫中心代理还可以快速找到答案，以缩短平均呼叫处理时间。检索和排名服务是开箱即用的，但也可以定制以改进结果

我想使用一些PDF、txt、html非结构化数据来训练一个机器学习系统，比如IBMWatson，然后通过API调用提问并获得答案。我怎样才能做到这一点？基于GUI的培训或基于API的培训。从Bluemix中，很难决定哪种服务最适合实现这一需求。您能推荐最佳选项吗？

检索和排名-检索和排名可以显示文档集合中最相关的信息。例如，使用R&R，经验丰富的技术人员可以从密集的产品手册中快速找到解决方案。呼叫中心代理还可以快速找到答案，以缩短平均呼叫处理时间。检索和排名服务是开箱即用的，但也可以定制以改进结果。更多细节

发现服务—通过转换、规范化和丰富非结构化数据，从中提取价值。使用一种简化的查询语言来浏览该数据，或快速访问预丰富的数据集，如Discovery News collection。更多详细信息

出于您的目的，我推荐Watson Discovery。它非常完整，支持GUI和API中的许多功能。它支持自然语言或查询格式的问题

其文件如下：

如果您创建了Watson Discovery的免费实例，您可以在此处测试其API：

这里有每个API调用的示例：

这里还有一个演示和相应的代码：和