Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/303.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 自然语言处理及其建议方法_Python_Nlp - Fatal编程技术网

Python 自然语言处理及其建议方法

Python 自然语言处理及其建议方法,python,nlp,Python,Nlp,我是NLP的新手,我想知道它是否适合我们的业务问题 我使用一个手术管理系统,该系统记录患者手术的细节。手术后,患者将有一个术后目的地,通常是医院的病房。问题是这是在一个非结构化的自由文本字段中捕获的,管理员可以在该字段中输入与手术有关的任何内容。此时,让供应商将其作为新字段添加到数据库中不是一个选项 我需要开发一些东西(最好是python)来尝试并确定患者在这个自由文本的op后要去哪里。结果类似于:“病房1”。一旦确定这一点,我们可以在结构化数据中查找关于病房1的其他详细信息,例如这是否是患者的

我是NLP的新手,我想知道它是否适合我们的业务问题

我使用一个手术管理系统,该系统记录患者手术的细节。手术后,患者将有一个术后目的地,通常是医院的病房。问题是这是在一个非结构化的自由文本字段中捕获的,管理员可以在该字段中输入与手术有关的任何内容。此时,让供应商将其作为新字段添加到数据库中不是一个选项

我需要开发一些东西(最好是python)来尝试并确定患者在这个自由文本的op后要去哪里。结果类似于:“病房1”。一旦确定这一点,我们可以在结构化数据中查找关于病房1的其他详细信息,例如这是否是患者的适当目的地

自由文本示例:

“接纳WD1 post op”

“恢复病房,然后是术后1病房”

“手术后进行MRI检查,然后接受WD1”

“在手术前进入Ward1。手术后目的地待确认”

解决方案需要处理描述手术后目的地的各种不同方式,并编写手术后目的地的变化(例如病房1、WD1、W1等)

我还没有开始编写代码,但我的初始方法是使用正则表达式来查找与后期目标匹配的文本,但我不想没完没了地为不同的变体编写代码。所以我认为这可能是NLP使用NLTK的问题


有人对如何处理这个问题有什么建议吗?任何建议的工具、技术、教程、以前的经验等,我都非常感谢。

首先,我不经常使用上面提到的免费文本,所以我的答案可能不是最好的。如果外科医生有完全的自由输入他们想要的任何东西,你需要接受这样一个事实,那就是有些病例无法处理(因为他们输入了一些无法解释的东西)。正则表达式功能强大,但从长远来看,处理/维护正则表达式可能是一场噩梦。NLP/NLTK是一个大型、功能强大的库,可能需要太多的研究,但收获甚微

我的方法是保持事情非常简单。我假设您可以访问python中的文本,我会将文本拆分为空格,这样您就有了单个单词的列表,然后扫描每个单词,以查找“已知”或“接受”的术语,如WD1、WARD1等。当然,这并不是完全直截了当的;您将有“WARD”“1”病例,但有一点胶水代码应该是可检测的

我不认为你的目标应该是100%地发现所有病例(无论听起来多么奇怪)。只需介绍大多数情况,这很可能会给您留下可维护/可扩展的代码,并且仍然会使您的流程自动化


祝你好运。

这是一个离题的话题,所以你要求推荐的方法。另一方面,您确实描述了问题和当前的方法。第三方面,没有代码。我的印象是,这绝不是NLP问题。我会继续使用正则表达式,看看这是否足够好。写一个匹配所需的“w”或“w”、可选的“ar”、可选的“d”或“d”、可选的空格、所需的数字的值。如果你在做这件事上有问题,那是个合理的问题,