用python清理文本_Python - Fatal编程技术网

用python清理文本

python

用python清理文本,python,Python,我想删除所有带数字的单词，并使所有单词都小写。代码如下： #remove words with numbers import re lower_alpha = lambda x: re.sub(r\"\"\"\\w*\\d\\w*\"\"\", ' ', x.lower()) data['reviews'] = data.reviews.map(lower_alpha) data.head() 但错误如下所示：下α=λx:re.sub（r\“\”\“\w*\d\w*\”，“”， x、下（

我想删除所有带数字的单词，并使所有单词都小写。代码如下：

#remove words with numbers
import re
lower_alpha = lambda x: re.sub(r\"\"\"\\w*\\d\\w*\"\"\", ' ', x.lower())
data['reviews'] = data.reviews.map(lower_alpha)
data.head()

但错误如下所示：

下α=λx:re.sub（r\“\”\“\w*\d\w*\”，“”， x、下（）^

SyntaxError:行连续字符后出现意外字符

文本中有一些无用的
，我使用以下代码将其删除：

#remove <br>    
remove_br = lambda x: re.sub(r\"\"\" br \"\"\", ' ', x.lower())
data['reviews'] = data.reviews.map(remove_br)
data.head()

#删除

删除\u br=lambda x:re.sub（r\“\”\“br\”\“\”，''，x.lower（））
data['reviews']=data.reviews.map（删除\u br）
数据标题（）

错误显示：

删除\u br=lambda x:re.sub（r\“\”\“br\”\“\”，''，x.lower（））^ SyntaxError:行连续字符后出现意外字符

几乎和前一个一样。有没有人能帮我找出这些东西的毛病

dataframe是一个excel工作表，类似于：用户id星评论

用户id星评论
xxx 5 xxxxx
xxx 5 xxxxx
xxx 5 xxxxx
xxx 4 xxxxx

您的打字错误是以特殊方式处理的。如果您使用的是原始字符串，只需使用

r'\“\”\\w*\\d\\w*\“\“\”

（如果它与您的逻辑匹配）

r\“\”。

是一个

语法错误。您需要首先从引号开始：r'\“\”。
可能重复的请删除最后一个反斜杠，否则将导致EOL
.Thx以供指出。不确定从逻辑角度看它意味着什么，只是用单引号括起来




[adobe]相关文章推荐



                                                        
Adobe CQ5中页面属性中的图像
adobeaem 
Adobe 当ACS commons错误页处理程序插入错误页时，i18n翻译不起作用
adobeaem 
如何采样Adobe Analytics（Omniture）数据
adobe 
节点/文件夹删除历史记录-Adobe AEM/CQ
adobeaem 
ADOBE DTM-基于活动CSS创建基于事件的规则
adobe 
Adobe 删除所有提示并保存到AcrobatDC中的指定文件夹？
adobe 
在Adobe Experience Manager中展开二维码
adobeaem 
如何使用sightly从Adobe AEM的列表中访问嵌套的子属性？
adobeaem 
                                       





随机文章推荐



                                                        
Drupal 6 Drupal查看参数
drupal-6 
Drupal 6 Drupal，其中是用户配置文件中的“编辑帐户”选项卡
drupal-6 
Drupal 6 如何在Drupal6中修改HTML标记？
drupal-6 
Drupal 6 Apachesolr drupal刻面在多行中断开
drupal-6solr 
Drupal 6 无法在Drupal 6中将字段添加到我的内容类型
drupal-6


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
在Python中创建加密的ZIP文件
									Python
							 
Python中的多元组到两对元组？
									Python
							 									Data Structures
							 
Python Is&#x10；XML中的有效字符？
									Python
							 									Xml
							 
在Python中，如何从一些源数据轻松生成图像文件？
									Python
							 									Image
							 
Python 创建灰度图像
									Python
							 
Python中的原始图像处理
									Python
							 									Image
							 
web应用程序未执行减法操作Python
									Python
							 									Html
							 									Css
							 									Flask
							 
如果与python中的模式匹配，则返回行
									Python
							 
如何使用python计算字典键中的重复日期？
									Python
							 
如何调试"；“多重陈述”；Python中的错误？
									Python
							 
Python 如果没有任何setup.py文件，如何在下载GitHub包后安装它
									Python
							 									Opencv
							 									Github
							 
Python-如果满足条件，如何退出程序？
									Python
							 
在python中获得一半的浮点值
									Python
							 									List
							 
如何删除撇号'；在Python中写入csv文件时
									Python
							 									Csv
							 
在列名上拆分python数据帧
									Python
							 									Pandas
							 
Python 当字符串列表交换为文本文件时，程序停止工作
									Python
							 									Python 3.x
							 
在使用python库rply时，我在解析多行代码时遇到了一个意外的令牌错误。我怎样才能解决这个问题？
									Python
							 									Parsing
							 
Python 如何继承带参数的类而不在超类中添加参数
									Python
							 									Class
							 									Inheritance
							 
Python Django保存删除新的一对一关系？
									Python
							 									Django
							 									Object
							 
我可以在Python中使用类方法来获取此类类型的参数吗？
									Python
							 									Python 3.x
							 									Types
							 
Python gekko中的模型约束
									Python
							 									Python 3.x
							 
Python 合并数据帧并重复值
									Python
							 									Pandas
							 
从无服务器文件夹外部导入自制Python模块
									Python
							 									Aws Lambda
							 
实现Python CANopen
									Python
							 
Python 3.4子流程文件NotFoundError WinError 2
									Python
							 									Python 3.x
							 
Python 如何填写熊猫中缺失的时间戳
									Python
							 									Pandas
							 
Python 如果语句变为false，请再次调用输入
									Python
							 									Python 3.x
							 
如何直接在python中播放语音而不保存为mp3？
									Python
							 
Python 抓取搜索/身份验证生成的页面
									Python
							 									R
							 									Selenium
							 									Web Scraping
							 
Python 试图从Git Bash运行Jupyter笔记本，但得到'；zmq.h'；没有文件或目录错误
									Python
							 									Git
							 									Jupyter Notebook
							 									Anaconda
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Frameworks
Iis
Computer Vision
Acumatica
Kubernetes
Botframework
Ruby On Rails 3.1
Asp.net
Ant
Workflow
Graph
Angular
Ocaml
Compression
Cmake
Pip
Codenameone
Dojo
Ftp
Twig
Big O
Vagrant
Ember.js
Parallel Processing
Hadoop
Templates
Android
Snowflake Cloud Data Platform
Google Chrome
Logic
Mqtt
Heroku
Tcp
Reporting Services
Powerbi
Primefaces
Office Js
Mediawiki
Google Cloud Storage
Installation
Office365
Inno Setup
Mips
Windows 7
Umbraco
Amazon Cloudformation
Zend Framework
Ibm Midrange
Memory
Aframe
Command Line
Azure Functions
Html5 Canvas
Sed
Here Api
Network Programming
Mapping
Caching
Neural Network
Playframework
Windows 8
Printing
Selenium Webdriver
Apache2
Visual Studio 2010
Winforms
Amazon Redshift
Actionscript
Google Cloud Platform
Log4j
Configuration
Doxygen
Instagram
Proxy
Process
Vuejs2
Sharepoint
Imagemagick
Linux
Soap
Combobox
Osgi
Oracle11g
Google Apps Script
Certificate
Cocoa Touch
Scripting
Apache Kafka
Firebase
Image Processing
Jqgrid
Ibm Mq
Orchardcms
Memory Management
Google Maps Api 3
Fiware
Appium
Sml
Kdb
Cloud
Google Cloud Dataflow
Salesforce
Menu
Hybris
Reflection
Drupal 7
Dns
Jms
Vhdl
Tableau Api
Google Api
Internationalization
Ios
Solr
.htaccess
Facebook
Sql Server 2012
Ssl
Automated Tests
Ms Office
Windows Phone 7
Sql Server
Quickbooks
Xamarin
Character Encoding
Streaming
Checkbox
Arm
Gradle
Com
Codeigniter
Nlp
Youtube
Google Plus
Asynchronous
Directory
Testng
Asp.net Web Api
C# 3.0
Iis 7
Geometry
Sdk
Terminal
Interface
Gps
Abap
Antlr4
Swagger
Rally
Swing
System Verilog
Apache Flink
Entity Framework Core
Merge
Sonarqube
Emacs
Java Me
Netlogo
Asp.net Core Mvc
Drools
Crystal Reports
Rss
Python 2.7
Vue.js
Wpf
Node.js
Open Source
Matplotlib
Signalr
Subsonic
Google Colaboratory
Filesystems
Gwt
Redirect
Java
Discord.js
Azure Active Directory
Zend Framework2
Silverlight
Jquery
Deployment
Ruby On Rails 3.2
Asp Classic
Stored Procedures
Selenium
Safari
Visual Studio 2008
Post
Android Ndk
Chef Infra
Web
Dart
Openlayers 3
Leaflet
Video Streaming
Listview
Material Ui
Google Calendar Api
Docusignapi
Single Sign On
Lucene


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网