Warning: file_get_contents(/data/phpspider/zhask/data//catemap/8/python-3.x/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Javascript 从非结构化字符串中提取键值对的最佳方法?_Javascript_Node.js_Machine Learning_Artificial Intelligence_Text Extraction - Fatal编程技术网

Javascript 从非结构化字符串中提取键值对的最佳方法?

Javascript 从非结构化字符串中提取键值对的最佳方法?,javascript,node.js,machine-learning,artificial-intelligence,text-extraction,Javascript,Node.js,Machine Learning,Artificial Intelligence,Text Extraction,避免特定模式的硬编码规则 我目前正在从事与AWS Textract类似的项目。我已经成功地从文件中提取数据,但是以非结构化的方式。现在,我正试图找出最好的方法,如何从这些信息中获取现有的键值对 例如,我们有这样一个文本: id : 1 country : France health : good 在本文档中,我们将找到不同的键和值,如id:1和国家:法国,没有特定标点符号,可能会谈论我的健康有多好 提取过程大致如下: id : 1 country : France health : good

避免特定模式的硬编码规则

我目前正在从事与AWS Textract类似的项目。我已经成功地从文件中提取数据,但是以非结构化的方式。现在,我正试图找出最好的方法,如何从这些信息中获取现有的键值对

例如,我们有这样一个文本:

id : 1
country : France
health : good
在本文档中,我们将找到不同的键和值,如id:1和国家:法国,没有特定标点符号,可能会谈论我的健康有多好

提取过程大致如下:

id : 1
country : France
health : good
我真正知道的是Amazon使用了一个“信心”变量从这种场景中提取信息,我猜这涉及到一些机器学习算法。就我而言,我没有那么大的数据库可供学习

我很确定有一个更简单的解决方案,而且灵活性也不差。

我相信库可能是满足您需求的合适工具。请查看GitHub上的描述以了解它


可以使用package将其暴露给Node JS。

这是一个自然语言处理问题,目前最好使用机器学习算法来解决。即使你能想出一个不需要先验信息的算法,你也需要根据一些数据来验证算法。很棒的用例!我也有类似的东西。你找到解决办法了吗?请分享你的方法。我现在就来试试。我会告诉你它是否给出了正确的结果。通常,指向工具或库的链接。如果工具或库不是免费使用的,请在回答中也提到这一点。