Nlp 从单词序列中提取句子并添加标点符号

Nlp 从单词序列中提取句子并添加标点符号,nlp,Nlp,我正在寻找一个图书馆或系统,可以尝试检测句子的边界和结构从一系列的话。这些单词来自演讲稿,包括填充词嗯和嗯,以及单词重复。下面是一个例子: [“你好”、“大家”、“今天”、“我们”、“是”、“要去”、“去”、“嗯”、“是”、“讨论”、“IO”、“流”、“与”、“IO”、“流”、“我们”…] Google Cloud能够使用enableautomaticpuntuation选项将标点符号添加到其Speech to text API的文本输出中,但是我还没有发现任何类似的将文本作为输入的方法。我建议

我正在寻找一个图书馆或系统,可以尝试检测句子的边界和结构从一系列的话。这些单词来自演讲稿,包括填充词嗯和嗯,以及单词重复。下面是一个例子:

[“你好”、“大家”、“今天”、“我们”、“是”、“要去”、“去”、“嗯”、“是”、“讨论”、“IO”、“流”、“与”、“IO”、“流”、“我们”…]


Google Cloud能够使用
enableautomaticpuntuation
选项将标点符号添加到其Speech to text API的文本输出中,但是我还没有发现任何类似的将文本作为输入的方法。

我建议您查看文本挖掘库,例如或。这些库具有内置的句子标记器。此外,您还可以根据将文本转换为句子列表的规则或缩写列表进行更新