Php 如何解释以下正则表达式中的忽略单词列表?

Php 如何解释以下正则表达式中的忽略单词列表?,php,regex,Php,Regex,我有一个正则表达式,可以把文本分成句子。然而,正则表达式把缩写词弄乱了,比如“i.e.”。有没有办法忽略一系列的缩写 我所拥有的: $sentences = preg_split('/(?<=[.?!])\s+(?=[a-z])/i', $string); $senses=preg_split('/(?试一试: (?<=(?<!\b(?:[i\.e\.])\b)[.!?])\s+(?=[\w]) (?你能提供一个示例$string?也许(即其他缩写)(*SKIP)(*FA

我有一个正则表达式,可以把文本分成句子。然而,正则表达式把缩写词弄乱了,比如“i.e.”。有没有办法忽略一系列的缩写

我所拥有的:

 $sentences = preg_split('/(?<=[.?!])\s+(?=[a-z])/i', $string);
$senses=preg_split('/(?试一试:

(?<=(?<!\b(?:[i\.e\.])\b)[.!?])\s+(?=[\w])

(?你能提供一个示例
$string
?也许
(即其他缩写)(*SKIP)(*FAIL)|)(?用一个简单的模式将文本拆分为单词、标点符号、字符或句子不是一件容易的事情。要清楚,PHP不是这样做的语言。最好使用Python或Java(可能还有Perl)你还需要经过训练的字典。在你最喜欢的搜索引擎(duckduckgo)中搜索nlp和nltk,否则你所做的一切都将是糟糕的DIY。