Scrapy:如何解决这个问题;“空的”;由于外语符号导致html中的项目?

Scrapy:如何解决这个问题;“空的”;由于外语符号导致html中的项目?,scrapy,scrapy-spider,Scrapy,Scrapy Spider,其中一个碎片项目似乎不包含HTML内容。在MySQL数据库中,它确实有一些内容,包括稍微长一点的非规则的-(破折号)。它可以是中文输入的破折号,或者类似的东西。我将它复制到下面,不确定它是否会保留原始形式。web链接为,此非规则破折号位于标题和描述的开头 **Hospitalist – Chattanooga** 为了进一步证明这一点,MySQL的导出CVS文件将这个奇怪的破折号转换为?€?。很可能是这个奇怪的符号导致了非显示问题 我想删除这个奇怪的符号,或者用、或常规破折号替换它。在哪里可

其中一个碎片项目似乎不包含HTML内容。在MySQL数据库中,它确实有一些内容,包括稍微长一点的非规则的
-
(破折号)。它可以是中文输入的破折号,或者类似的东西。我将它复制到下面,不确定它是否会保留原始形式。web链接为,此非规则破折号位于标题和描述的开头

**Hospitalist – Chattanooga** 
为了进一步证明这一点,MySQL的导出CVS文件将这个奇怪的破折号转换为
?€?
。很可能是这个奇怪的符号导致了非显示问题


我想删除这个奇怪的符号,或者用
或常规破折号替换它。在哪里可以做到?刮胡子的时候?还是MySQL?抱歉,这不是一个特定的编码问题。在找出这个问题的代码之前,我需要一些指导

长破折号称为EM破折号 您看到它的原因可能是由于选择了编码

请尝试设置不同的编码或将EM破折号替换为问题中提到的符号

在php中,可以使用以下代码执行此操作:

str_replace(chr(151), ',' $input);

长破折号称为EM破折号 您看到它的原因可能是由于选择了编码

请尝试设置不同的编码或将EM破折号替换为问题中提到的符号

在php中,可以使用以下代码执行此操作:

str_replace(chr(151), ',' $input);