Python 修复nltk处理文本中替换的引号

Python 修复nltk处理文本中替换的引号,python,string,nltk,Python,String,Nltk,我正在用NLTK处理文本,我遇到的一个小问题是: I am tired of people "quoting me". It's pathetic and annoying! 将变成: I am tired of people `` quoting me ''. its pathetic and annoying! 我很确定这是在标记化过程中发生的 现在我可以很容易地使用.replace(“``,“\”)和.replace(“`,“\”)但是有没有更有效的方法呢?结果提供

我正在用NLTK处理文本,我遇到的一个小问题是:

I am tired of people "quoting me". It's pathetic and annoying!
将变成:

I am tired of people `` quoting me ''. its pathetic and annoying!
我很确定这是在标记化过程中发生的


现在我可以很容易地使用
.replace(“``,“\”)
.replace(“`,“\”)
但是有没有更有效的方法呢?

结果提供了更多的信息,机器可以很容易地读取这些信息。它为任何读取字符串的代码提供了一个清晰的指示,即开始引号在哪里,结束引号在哪里。在不同的环境中,不同的符号用于开始和结束报价,因此这些信息可能非常有价值。当然,这取决于你想做什么。现在我已经完成了处理,所以我只是想把它恢复到正常格式。但是如果它是机器可读的,那么是否有任何lib可以使用它,甚至可能是一个nltk模块?我看了一下,但什么也没看到。不,我认为你所拥有的(
.replace(…)
)可能是完成你所尝试的最好的方法。作为一个更容易阅读的代码示例:这正是TeX和LaTeX引号的工作方式。哦,这可能会很有用,非常感谢!