Javascript 从客户语音中提取字母数字字符串

Javascript 从客户语音中提取字母数字字符串,javascript,node.js,ibm-watson,watson-conversation,Javascript,Node.js,Ibm Watson,Watson Conversation,我现在正在做一个语音机器人。我在提取pan卡号(hazwr2312g)时遇到困难。客户可以通过多种不同的方式提供。例如,他们可以说我的pan id是(hazwr2312g) 我已经创建了一个基于pan规则的正则表达式,它运行良好/[a-z]{3}[abcfghljpte][a-z][0-9]{4}[a-z]/I并提取pan编号 然而,当客户通过语音提供pan编号时,句末的“g”通常被“ji”(hazwr2312 ji)替换 各种话语: 1) 我的锅号是hazwr2312吉 2) hazwr231

我现在正在做一个语音机器人。我在提取pan卡号(hazwr2312g)时遇到困难。客户可以通过多种不同的方式提供。例如,他们可以说我的pan id是(hazwr2312g)

我已经创建了一个基于pan规则的正则表达式,它运行良好/[a-z]{3}[abcfghljpte][a-z][0-9]{4}[a-z]/I并提取pan编号

然而,当客户通过语音提供pan编号时,句末的“g”通常被“ji”(hazwr2312 ji)替换

各种话语:

1) 我的锅号是hazwr2312吉 2) hazwr2312是我的盘号 3) 它是hazwr2312集 4) 嗯,我的身份证是hazwr2312 ji

诸如此类

我如何处理这个问题?请引导我

问候
满足

您可以尝试使用
regex
或选择
split
indexOf
等,如果您有经常出现或常见的特定类型的关键字。

您需要了解有关pan卡的规则。这些pan卡号模式是怎样的。如果你知道这些规则,你可以搜索。没有它们就不可能。PAN结构如下:AAAPL1234C:前五(5)个字符是字母,后面是四(4)个数字,最后一(10)个字符是字母