Python 修复nltk处理文本中替换的引号_Python_String_Nltk

Python 修复nltk处理文本中替换的引号

python string

Python 修复nltk处理文本中替换的引号,python,string,nltk,Python,String,Nltk,我正在用NLTK处理文本，我遇到的一个小问题是： I am tired of people "quoting me". It's pathetic and annoying! 将变成： I am tired of people `` quoting me ''. its pathetic and annoying! 我很确定这是在标记化过程中发生的现在我可以很容易地使用.replace（“``，“\”）和.replace（“`，“\”）但是有没有更有效的方法呢？结果提供

我正在用NLTK处理文本，我遇到的一个小问题是：

I am tired of people "quoting me". It's pathetic and annoying!

将变成：

I am tired of people `` quoting me ''. its pathetic and annoying!

我很确定这是在标记化过程中发生的

现在我可以很容易地使用

.replace（“``，“\”）

和

.replace（“`，“\”）

但是有没有更有效的方法呢？

结果提供了更多的信息，机器可以很容易地读取这些信息。它为任何读取字符串的代码提供了一个清晰的指示，即开始引号在哪里，结束引号在哪里。在不同的环境中，不同的符号用于开始和结束报价，因此这些信息可能非常有价值。当然，这取决于你想做什么。现在我已经完成了处理，所以我只是想把它恢复到正常格式。但是如果它是机器可读的，那么是否有任何lib可以使用它，甚至可能是一个nltk模块？我看了一下，但什么也没看到。不，我认为你所拥有的（

.replace（…）

）可能是完成你所尝试的最好的方法。作为一个更容易阅读的代码示例：这正是TeX和LaTeX引号的工作方式。哦，这可能会很有用，非常感谢！