Python 如何处理utf-8字符串,因为我想替换—;在我的文本中使用空格,然后使用拆分功能将每个单词与其他单词分开
我试图将一页中的所有单词放在一个字符串中,然后用空格替换Python 如何处理utf-8字符串,因为我想替换—;在我的文本中使用空格,然后使用拆分功能将每个单词与其他单词分开,python,python-3.x,string,Python,Python 3.x,String,我试图将一页中的所有单词放在一个字符串中,然后用空格替换-(utf-8)。 我可以这样做,但是当我执行split()操作时,由空格分隔的单词被放在一起。例如,关于它-->关于它替换后,当我进行拆分时,列表中的单词是“关于它”,即没有空格 我尝试从utf-8格式复制-。它会替换它,但不会改变它 book_content = book_content.replace('—', ' ') book_content = book_content.replace('_', ' ') book_text =
-
(utf-8)。
我可以这样做,但是当我执行split()
操作时,由空格分隔的单词被放在一起。例如,关于它
-->关于它
替换后,当我进行拆分时,列表中的单词是“关于它”
,即没有空格
我尝试从utf-8格式复制-
。它会替换它,但不会改变它
book_content = book_content.replace('—', ' ')
book_content = book_content.replace('_', ' ')
book_text = book_content
book_text = book_text.replace("\n", " ")
list_of_contents = book_text.split()
所需输出为:
about it (readable string)
and ['about' , 'it']
请编辑您的问题,并向我们显示清晰、可读的示例输入和您期望的输出。无法复制。请提供一个可复制的示例。