如何删除“🇺🇸&引用;来自python中的字符串?
我试图从facebook中提取数据,但在抓取数据时,我遇到了unicode类型错误。事实上,我正试图抓取的文本包含如下信息:如何删除“🇺🇸&引用;来自python中的字符串?,python,selenium-webdriver,scrapy,Python,Selenium Webdriver,Scrapy,我试图从facebook中提取数据,但在抓取数据时,我遇到了unicode类型错误。事实上,我正试图抓取的文本包含如下信息: Hi, this is textThis question is similar to this one: Selenium webdriver and unicode They recommend converting the whole page to ascii using: (driver.page_source).encode('ascii', 'ignor
Hi, this is textThis question is similar to this one: Selenium webdriver and unicode
They recommend converting the whole page to ascii using:
(driver.page_source).encode('ascii', 'ignore')
Hi,这是文本这个问题与这个问题类似:
他们建议使用以下方法将整个页面转换为ascii:
(driver.page_source).encode('utf-8')
您还可以将其编码为utf-8:
加载指定页面后,只需添加(driver.page\u source)。编码('ascii','ignore')
您还可以将其编码为utf-8。添加(driver.page\u源代码)。编码('ascii','ignore')
。这就是您所要做的。您可以选择在报废时忽略任何非ascii字符;只需添加(driver.page\u source)。encode('ascii','ignore')
您在加载页面(driver.get)
后添加它,只是想知道为什么人们会重复其他人的答案。被接受的答案包含其他答案所写的部分,并且似乎也没有编辑以包含相同的部分。