“问题提取”；提到；使用regex从Twitter数据_Regex_Pandas - Fatal编程技术网

“问题提取”；提到；使用regex从Twitter数据

regex pandas

“问题提取”；提到；使用regex从Twitter数据,regex,pandas,Regex,Pandas,我试图从推特上提取推文中提到的内容，即@Google或@Apple 这是我到目前为止从一个列中提取提到的内容，然后用这些内容创建另一个列的代码 df_bdtu['mentions'] = df_bdtu['tweet_text'].str.findall('(?:^|\s)[＠ @]{1}([^\s#<>[\]|{}]+)') dfu-bdtu['notices']=df\u-bdtu['tweet\u text'].str.findall（'（？：^^\s）[312@]{1}（[

我试图从推特上提取推文中提到的内容，即

@Google

或

@Apple

这是我到目前为止从一个列中提取提到的内容，然后用这些内容创建另一个列的代码

df_bdtu['mentions'] = df_bdtu['tweet_text'].str.findall('(?:^|\s)[＠ @]{1}([^\s#<>[\]|{}]+)')

dfu-bdtu['notices']=df\u-bdtu['tweet\u text'].str.findall（'（？：^^\s）[312@]{1}（[^\s.[\]{}+]））

它主要起作用，但我在一些边缘案例中面临一些问题，例如，以这条推文为例：

Check out @Dreams_n_Songs and give them a follow! I can't recommend their hoodies enough!Shop now  You can use
[＠@]([^][\s#<>|{}]+)

查看@Dreams\u n\u歌曲，并对其进行跟踪！我怎么推荐他们的连帽衫都不够！现在购物你可以使用
[＠@]（[^][\s#|{}]+）

看。因此，删除（？：\s | ^）
，它需要字符串开头或匹配开头的空格，并且需要从[＠@]
字符类中删除文本空格
在Pandas代码中，您可以这样使用它：
df#u bdtu['notices']=df#u bdtu['tweet#u text'].str.findall（r'[＠@]（[^][\s#{}]+）

请注意r'…'
原始字符串文字符号。
感谢您的完美工作，也请欣赏详细的答案。当我被允许的时候，我会接受答案。




[pandas]相关文章推荐



                                                        
Pandas 熊猫数据帧。到_csv
pandas 
Pandas 使用列名将系列连接到数据帧上
pandasdataframe 
Pandas 熊猫能否根据其名称中的模式拆分/合并列？
pandasdataframe 
Pandas 将数据帧转换为具有多索引的系列
让我们考虑一个熊猫数据文件（DF），如上面所示的。
pandas 
Pandas 熊猫5岁及以上；10年移动平均线
pandas 
Pandas 派林，熊猫：与真实的比较应该是'；expr'；或'；expr为真'；（单例比较）
pandasdataframe 
使用pandas filter函数后返回列表
pandas 
Pandas 如何创建agg func来处理熊猫中的除法0？
pandas 
Pandas 如何在数据帧中按行计算组中的空值
pandas 
Pandas 删除编码“；UTF8"；：psycopg2游标数据帧中的0x00字符
pandaspostgresqlencodingutf-8sqlalchemy 
Pandas 查找支持列表和集合以及INT和str的混合数据类型的空单元格
pandaslist 
Pandas 如何修复矩阵中过长的轴标签？
pandasmatrixplot 
Pandas 如何添加在不包括NaT的文本行组上递增的索引
pandas 
Pandas 矢量化熊猫申请pd.date\U范围
pandasnumpy 
Pandas GroupBy独特的聚集性和熊猫的特定条件
pandas 
Pandas 熊猫系列-添加单个值和删除特定行的简单方法
pandas 
Pandas 复杂数据集下采样问题
pandas 
Pandas 包含字典列表的列的pyarrow数据类型？
pandas 
Pandas 基于列'；绘制子地块；通过使用loop来定义s值
pandasmatplotlib 
Pandas 属性错误：'；浮动'；对象没有属性'；isnumeric'；
pandas 
                                       





随机文章推荐



                                                        
DB2事务日志已满。如何冲洗/清除？
db2amazon-ec2 
DB2删除并创建表
db2 
使用代理将数据从Lotus Notes传输到DB2
db2lotus-notes 
DB2z/OS中的表值用户定义函数
db2 
Db2 重点还是案例陈述？
db2 
db2as400&RPG请解释关系
db2ibm-midrange 
DB2将行转换为列
db2 
如何在DB2中查找表的模式？
db2 
z/os DB2 V 9.1多行插入失败错误代码-104
db2 
通过SSL连接将Squirrel客户端连接到DB2服务器
db2 
DB2的日期函数
db2 
在db2中导出ixf
db2 
Db2 合并连续的重复记录，包括时间范围
db2 
如何使用CASE子句（DB2）显示来自不同表的值？
db2 
DB2表分区
db2


                                        

                                        
                                        


                                                
                                                        [regex]相关推荐
                                                        
Regex 用于动态URL目标设置的正则表达式
									Regex
							 									Google Analytics
							 
Regex 正则表达式以匹配日/月/年格式的日期并检查有效值
									Regex
							 									Vb.net
							 
Regex 正则表达式算法
									Regex
							 									Algorithm
							 
Regex 用于查找数字0或十进制的正则表达式
									Regex
							 
Regex 带有或的正则表达式。我做错了什么？
									Regex
							 									Perl
							 
Regex 从pdf文件中提取邮政地址
									Regex
							 									Pdf
							 									Text
							 
Regex 使用正则表达式检测特定字符串的开头、中间或结尾
									Regex
							 									String
							 									Search
							 
Regex 匹配正则表达式以获取属性
									Regex
							 
Regex 正则表达式：将电子邮件地址与GAPP的子域匹配
									Regex
							 									Gmail
							 
Regex 如何将VI中的搜索选择复制到剪贴板并粘贴到同一文件中？
									Regex
							 									Linux
							 									Bash
							 
Regex 更改nginx重写正则表达式条件
									Regex
							 									Nginx
							 
Regex 为什么这个正则表达式不能正常工作？
									Regex
							 
Regex 如何添加+；统治
									Regex
							 									Cakephp
							 
Regex 如何使用EGREP搜索一行中第一个出现的图案
									Regex
							 									Linux
							 									Grep
							 
Regex 从行中提取子字符串
									Regex
							 									Perl
							 									Tcl
							 
Regex 不带空格的密码验证正则表达式C#
									Regex
							 
Regex 删除数字周围的引号
									Regex
							 									Linux
							 									Sed
							 
regex返回所有值，而不仅仅是第一次找到的值
									Regex
							 									Apache Pig
							 
Regex 在这种情况下，为什么正则表达式是懒惰的而不是贪婪的？
									Regex
							 
REGEXP TCL中的多个捕获组
									Regex
							 									Tcl
							 
Regex 正则表达式：货币金额超过5000000
									Regex
							 
Regex 查找序列中的最小模式
									Regex
							 
防止嵌套组破坏regexp匹配（TCL）
									Regex
							 									Tcl
							 
Regex 如何将字符串按4分组？
									Regex
							 									Perl
							 
Regex 如何精确匹配[Test，Dev，Prod]集合中的1？
									Regex
							 
Regex MacOS终端查找和正则表达式问题
									Regex
							 									Macos
							 									Replace
							 
使用REGEX REPLACE按第一段对URL路径进行分组
									Regex
							 
Regex 如何使正则表达式非贪婪地提取特定元素
									Regex
							 									Python 3.x
							 
Regex 正则表达式：从字符串中提取键/值
									Regex
							 
Regex 如何在Scala Spark中用N/A替换空字符串？
									Regex
							 									Scala
							 									Apache Spark
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Llvm
Here Api
Installation
Kendo Ui
For Loop
Lua
Google Api
Kibana
Artifactory
Gis
Iframe
Firebase
Sqlite
Kdb
Maven
Ssis
Cocos2d Iphone
Sitecore
Authentication
File Upload
Processing
Random
Jakarta Ee
Clojure
Tableau Api
Sbt
Vmware
Javafx 2
Node.js
Scripting
Windows Services
Jasper Reports
Nsis
Merge
Time
Twitter
Pandas
Asp.net Mvc 2
Prestashop
Magento
Usb
Debian
Command Line
Ssrs 2008
Airflow
Nosql
Functional Programming
Spring Boot
Sharepoint 2013
Modelica
Angular6
Telegram
Jquery
Google Drive Api
Cassandra
Ibm Cloud
Unit Testing
Mono
Video
Permissions
Zend Framework2
Coffeescript
Amazon Cloudformation
Database Design
Asp.net Mvc 3
Session
Google Analytics
Dataframe
Linq To Sql
Ionic2
C++
Entity Framework
Ravendb
Ios4
Centos
Three.js
Python
Macros
Openid
Filter
Jira
Mule
View
Compression
Nestjs
Sharepoint 2007
Tfs
Silverlight 4.0
Architecture
Mercurial
Smalltalk
Bots
Lucene
Plone
Lotus Notes
Apache
Apache Zookeeper
Jqgrid
Jquery Plugins
Office365
Bison
Version Control
Generics
Tridion
Rest
Nuget
Image Processing
Mysql
Zsh
Latex
Calendar
Firefox
Opengl Es
Mobile
Xcode4
Statistics
Select
Spring Batch
Air
Windows Phone
Omnet++
Weblogic
Drupal 7
Electron
Makefile
Silverstripe
Graphql
Web Applications
Sublimetext2
Windows 10
Objective C
Selenium
Menu
Nginx
Tabs
Vim
Amazon Ec2
Validation
Programming Languages
Winforms
Quickbooks
Rss
Dictionary
Character Encoding
Binary
Tsql
Syntax
Maps
Teamcity
Awk
Windows 7
Z3
Websphere
Drop Down Menu
Reflection
Templates
User Interface
Less
Karate
Mpi
Docker
Events
Iis 7
Json
Domain Driven Design
Google Calendar Api
Virtual Machine
Notifications
Google Cloud Firestore
Octave
Stripe Payments
Reporting Services
Breeze
Opengl
Sqlalchemy
Wicket
Testng
Stata
Zurb Foundation
Corda
Webpack
Sonarqube
Oracle Apex
Qt4
Jhipster
Chart.js
Django Models
Deployment
Cookies
Ldap
Gcc
Stored Procedures
Rdf
Cuda
Google Visualization
Android Emulator
Service
Axapta
Grid
Gwt
Cocoa


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网