正则表达式解析python中的对话_Python_Regex - Fatal编程技术网

正则表达式解析python中的对话

python regex

正则表达式解析python中的对话,python,regex,Python,Regex,我想用python解析文件中的三种类型的行： “Name”“有话要说！” “只是一个描述性的句子” 名称“有话要说！” 我想知道名字和句子，如果没有名字，就说背景。我使用re读取文件的每一行，以查看正则表达式是否匹配。除此之外，它的工作原理非常好： “Name”“有话要说！” 它只返回整个内容，而不是两个部分这是我的正则表达式： r“（\”[a-zA-z？]*\”[a-zA-z]*）\s\”（.+）\” 您可以使用带有反向引用的捕获组来匹配或不匹配附带的双引号然后，您可以将整个第一部分（

我想用python解析文件中的三种类型的行：

“Name”“有话要说！”
“只是一个描述性的句子”
名称“有话要说！”

我想知道名字和句子，如果没有名字，就说背景。我使用

re

读取文件的每一行，以查看正则表达式是否匹配。除此之外，它的工作原理非常好：

“Name”“有话要说！”

它只返回整个内容，而不是两个部分

这是我的正则表达式：

r“（\”[a-zA-z？]*\”[a-zA-z]*）\s\”（.+）\”

您可以使用带有反向引用的捕获组来匹配或不匹配附带的双引号

然后，您可以将整个第一部分（包括空格字符）设置为可选，并在双引号之间匹配第二部分

请注意，

[a-zA-z]

比

[a-zA-z]

大，字符类中的

？

与问号完全匹配

比赛分为第一组和第三组

(?:(("?)[a-zA-Z]+\2)\s)?("[^"]+")

```
（？：
```
非捕获组
- ```
（
```
  Capturegroup 1
  - ```
  （“？）
```
  在组2中捕获可选的
```
  ”
```
- ```
[a-zA-Z]+
```
    匹配a+乘以字符a-zA-Z a
  - ```
  \2
```
  对组2的反向引用，以精确匹配该组中匹配的内容
- ```
）\s
```
  关闭组1并匹配空白字符
```
）？
```
关闭非捕获组并将其设置为可选
```
（“[^”]+”
```
捕获组3，从
```
“
```
匹配到
```
”
```

见a |

使用re.finditer循环匹配的示例：

import re

regex = r"(?:((\"?)[a-zA-Z]+\2)\s)?(\"[^\"]+\")"
s = ("\"Name\" \"Something to say !\"\n"
            "\"Just a descriptive sentence\"\n"
            "name \"Something to say !\"\n"
            "\"Name\" \"Something to say !\"")

matches = re.finditer(regex, s)
for matchNum, match in enumerate(matches, start=1):
        print(f"Name: {match.group(1)} Sentence: {match.group(3)}")

输出

Name: "Name" Sentence: "Something to say !"
Name: None Sentence: "Just a descriptive sentence"
Name: name Sentence: "Something to say !"
Name: "Name" Sentence: "Something to say !"

您可以使用带有反向引用的

“

捕获组来匹配或不匹配附带的双引号

然后，您可以将整个第一部分（包括空格字符）设置为可选，并在双引号之间匹配第二部分

请注意，

[a-zA-z]

比

[a-zA-z]

大，字符类中的

？

与问号完全匹配

比赛分为第一组和第三组

(?:(("?)[a-zA-Z]+\2)\s)?("[^"]+")

```
（？：
```
非捕获组
- ```
（
```
  Capturegroup 1
  - ```
  （“？）
```
  在组2中捕获可选的
```
  ”
```
- ```
[a-zA-Z]+
```
    匹配a+乘以字符a-zA-Z a
  - ```
  \2
```
  对组2的反向引用，以精确匹配该组中匹配的内容
- ```
）\s
```
  关闭组1并匹配空白字符
```
）？
```
关闭非捕获组并将其设置为可选
```
（“[^”]+”
```
捕获组3，从
```
“
```
匹配到
```
”
```

见a |

使用re.finditer循环匹配的示例：

import re

regex = r"(?:((\"?)[a-zA-Z]+\2)\s)?(\"[^\"]+\")"
s = ("\"Name\" \"Something to say !\"\n"
            "\"Just a descriptive sentence\"\n"
            "name \"Something to say !\"\n"
            "\"Name\" \"Something to say !\"")

matches = re.finditer(regex, s)
for matchNum, match in enumerate(matches, start=1):
        print(f"Name: {match.group(1)} Sentence: {match.group(3)}")

输出

Name: "Name" Sentence: "Something to say !"
Name: None Sentence: "Just a descriptive sentence"
Name: name Sentence: "Something to say !"
Name: "Name" Sentence: "Something to say !"

解决方案在我看来，您最好的选择是使用命名的捕获组。以下是方法：

重新导入
行=[
“说出”“要说的话！”，
“只是一个描述性的句子”，
“说出”要说的话
]
p=重新编译（r“（\”？（？p.+）\”？）（\”（？p.+）\”））
对于行中的行：
m=p.搜索（行）
打印（m[“part1”]）
打印（m[“第二部分”]）

输出将是

Name
Something to say !
None
Just a descriptive sentence
name
Something to say !

解释 regex

（\“？（？p.+）\”？（\“（？p.+）\”）包含两个主要部分。我会看第一个，（\”？（？P.+）\”？
。第二个非常相似

带有“零或多”量词的外部组（…）？
。因此，在第二种情况下，只有“part2”捕获组将处于活动状态
在该组中，引号还标有“零或多”量词，以涵盖第三种情况：\”？
零件（？P.+？）匹配引号之间的文本，并指定名称“零件1”，以便于访问。

匹配所有符号
+？
惰性地匹配一个或多个前一个引号（根据需要尽可能多的字符，尽可能少）。这是从匹配中排除第二个引号所必需的



使用这个正则表达式，您可以通过方括号语法访问命名捕获组的内容，如上面的代码所示
捕捉引用
如果您不仅想捕获引号中的文本，还想捕获引号本身，只需将\“
移动到命名的捕获组中，如：（（？p\“？。+？\”）？（（？p\“+”））
解决方案
在我看来，您最好的选择是使用命名的捕获组。以下是方法：
重新导入
行=[
“说出”“要说的话！”，
“只是一个描述性的句子”，
“说出”要说的话
]
p=重新编译（r“（\”？（？p.+）\”？）（\”（？p.+）\”））
对于行中的行：
m=p.搜索（行）
打印（m[“part1”]）
打印（m[“第二部分”]）

输出将是
Name
Something to say !
None
Just a descriptive sentence
name
Something to say !

解释
regex（\“？（？p.+）\”？（\“（？p.+）\”）包含两个主要部分。我会看第一个，（\”？（？P.+）\”？
。第二个非常相似

带有“零或多”量词的外部组（…）？
。因此，在第二种情况下，只有“part2”捕获组将处于活动状态
在该组中，引号还标有“零或多”量词，以涵盖第三种情况：\”？
零件（？P.+？）匹配引号之间的文本，并指定名称“零件1”，以便于访问。

匹配所有符号
+？
惰性地匹配一个或多个前一个引号（根据需要尽可能多的字符，尽可能少）。这是从匹配中排除第二个引号所必需的



使用这个正则表达式，您可以通过方括号语法访问命名捕获组的内容，如上面的代码所示
捕捉引用
如果你愿意




[regex]相关文章推荐



                                                        
Regex Perl正则表达式问题
regexperl 
Regex 特定问题的正则表达式
regex 
Regex 如何允许if语句从上述正则表达式访问捕获组？
regexperlvmware 
Regex 正则表达式正向前瞻
regexperl 
Regex 正则表达式差异
regex 
Regex 重定向不工作？
regexwordpressapache.htaccessmod-rewrite 
Regex 如何在perl中使用find text作为变量？
regexperl 
Regex Google Analytics URL编码百分比与跨域Cookie问题
regexfiltergoogle-analytics 
Regex Postgres正则表达式和特殊字符
regexpostgresql 
Regex 正则表达式JSON响应Gatling压力工具
regexjsonscalahttp 
Regex 正则表达式在和标记之间查找和替换
regex 
Regex 在记事本中使用正则表达式查找和替换++
regexreplacenotepad++ 
Regex 正则表达式一部分的含义
regex 
Regex 正则表达式：在url中查找usename
我正在努力创建正确的正则表达式模式，以便在URL的中间找到用户名字符串。简言之，我在Powershell中工作，拉下一个网页，清除li元素。我把它写到一个文件中，所以我有一大堆这样的行：
<LI><A HREF="/grouplist/expand-user/jimmysmith">Smith, Jimmy</A>&nbsp;
regexpowershell 
Regex 如何在正则表达式中输出模式的重复次数？
regexawksed 
Regex 我如何更改我的正则表达式，使其正确地应用于我试图刮取的URL？
regexpython-3.xselenium-webdriver 
Regex 给定两个正则表达式，确定其中一个是否是另一个的补充
regex 
Regex 如何在perl中将类似于XX1/XXSomething/XX1/Something的模式更改为XXSomething/XX1/Something
regexperl 
Regex MLlib正则表达式忽略重音
regex 
Regex 正则表达式：匹配所有内容，但不匹配特定的模式
regex 
                                       





随机文章推荐



                                                        
Vagrant 要我把流浪汉文件夹的版本修改一下吗
vagrant 
Vagrant 无法从环境生产源检索信息
vagrantpuppet 
如何通过SSH连接到Vagrant 1.6 Docker提供程序设置的boot2docker主机vm中？
vagrantdocker 
Vagrant 流浪包命令失败
vagrantvirtualbox 
更新了Vagrantfile，但仍收到警告，说明我的Vagrantfile已过时
vagrant 
Vagrant 使用apt模块进行Ansible无人值守安装
vagrantansible 
Vagrant 无法在流浪木偶中获取metalink
vagrantpuppet 
Vagrant 如何阻止工头登录到标准输出？
vagrant 
Vagrant 设备上没有剩余空间
vagrantvirtualbox 
Vagrant 流浪者重新加载同步的\u文件夹
vagrant 
Vagrant 如何使用同一个流浪者供应器设置测试环境
vagrantchef-infra 
Vagrant 流浪汉无法与VirtualBox通信：devic的ioctl不合适
vagrantvirtual-machinevirtualbox 
Vagrant 流浪汉上元'；无法启动虚拟机
vagrant 
安装Vagrant box时没有config.yaml文件
vagrant 
Vagrant 如何强制在流浪机器上运行剧本？
vagrantansible 
Vagrant '；流浪汉ssh'；使用旧的删除框
vagrantvirtualbox 
如何排除（忽略）vagrant rsync中的某些文件夹？
vagrant 
Vagrant 在定义多个虚拟机时避免重复配置
问题
vagrant 
Vagrant chef cookbook中nexus_api的默认属性覆盖无法更新值
vagrantchef-infra 
卸载vagrant proxyconf不会'；不要删除代理设置
vagrant


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
记事本++；为匹配模式的数字添加值的Python代码
									Python
							 									Regex
							 									Notepad++
							 
需要Python语法解释吗
									Python
							 									Python 2.7
							 
简单python语法
									Python
							 
Python 产生错误的输出
									Python
							 									Debugging
							 
Python 如何从大型（.json）列表结构访问路径坐标
									Python
							 									Json
							 
Python 谷歌融合地图信息窗口动态模板
									Python
							 									Css
							 									Google Maps
							 
Python—为什么在这段代码中会忽略我的else语句？
									Python
							 									If Statement
							 
使用python生成6位pin码
									Python
							 									Cryptography
							 
Python看门狗在一个无休止的循环中完成，因为它监视的文件上的文件操作
									Python
							 
Python变量未按预期工作
									Python
							 									Variables
							 
如何使用python读取/写入csv文件中的多维列表？
									Python
							 									Csv
							 									Io
							 
Python Django-聚合模型中字段的相等值
									Python
							 									Django
							 
Python 在sklearn近邻搜索中，余弦距离非常大
									Python
							 
python中不带日历模块的从日期算起的星期几
									Python
							 									Python 2.7
							 
Python 切片中的默认值是什么？
									Python
							 									Python 3.x
							 
将日期列表加载到python 3.6
									Python
							 									Function
							 									Date
							 									Text
							 
使用python for Klipfolio进行数据预处理的可能性有多大
									Python
							 
在python中将二进制文件转换为字符串
									Python
							 									String
							 									Binary
							 
在Python中发送带有附件的邮件时出错
									Python
							 									Python 3.x
							 
Python 熊猫阅读
									Python
							 									Pandas
							 
Python 我的21点游戏代码有什么问题？
									Python
							 
Python 如何使QTextBrowser中的文本可选择？
我希望能够以非自定义的方式选择一段文字，点击文本中间的网站链接的方式（“你好，我的名字是www. Google .com”），当你按下它时，它不会被高亮显示。当你按下它时，它会把你带到我想要的文本中。“你好，我的名字是杰夫，我住在伦敦，我每天都吃土豆”我希望用户能够单独选择每一句话（“你好，我的名字是杰夫”），单独选择（“我住在伦敦”），所以当用户在一个句子上移动鼠标光标时，它会高亮显示（就像准备被选择一样）然后我想给它添加一些功能
									Python
							 
Python 如何正确导入52扑克牌组的csv文件？
									Python
							 									Python 3.x
							 									Csv
							 
Python 比较两个具有不同对象的列表，如果值不'；不匹配
									Python
							 									Django
							 									List
							 
如何使用python制作voip客户端-Raspberry Pi
									Python
							 									Python 3.x
							 									Sip
							 
Python 如何在写入行时替换行中第一次出现的字符串
									Python
							 									Python 3.x
							 
Python 如何在已经开发的Django用户表数据库中添加更多表字段
									Python
							 									Django
							 									Django Models
							 
Python 如何生成特定数量的随机数？
									Python
							 									Loops
							 									Random
							 
python中的神经元网络错误：应具有形状（…），但获得具有形状（…）的数组
									Python
							 									Keras
							 
理解python中的插入排序
									Python
							 									Sorting
							 									Arrays
							 									Python 3.x
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Import
Marklogic
Processing
Opencart
Json
Dll
Ruby On Rails 3.2
Stm32
Architecture
Functional Programming
Mongoose
Mercurial
Python Sphinx
Generics
Apache Flink
Python 2.7
Button
Hazelcast
Sas
Uiview
Docusignapi
Types
Hadoop
Authentication
Migration
Outlook
Spring Cloud
Grails
Dynamics Crm
Ios8
Tcl
Ios4
Sms
Uitableview
Erlang
View
Coldfusion
Clang
Javafx
Activemq
Acumatica
Pip
Asp.net Mvc 3
Plugins
Validation
Logstash
Spring
Gradle
Amp Html
Perl
Ldap
Events
Swift3
Web Scraping
Binary
Makefile
Xmpp
Rest
Grep
Mqtt
Optimization
Pyspark
Eclipse Rcp
Iframe
Redux
Webgl
Windows Phone 8
Indexing
Netlogo
Xcode
Node.js
Typo3
Groovy
Twilio
Macros
Sharepoint 2007
Doxygen
Typescript
Ajax
Dotnetnuke
Cocos2d X
Visual Studio 2017
Geometry
Collections
Regex
Extjs4
Drupal 7
Primefaces
Azure Cosmosdb
Vb.net
Nativescript
Amazon Cloudformation
Ionic2
Grid
Angular Material
Tridion
Vmware
Isabelle
Asp.net Mvc
C# 4.0
Amazon Redshift
Yaml
Testing
Robotframework
Scripting
File Upload
String
Nlp
Discord
Testng
Orm
System Verilog
Quickbooks
Yii2
Xamarin.forms
Active Directory
Pdf
Url Rewriting
Azure Data Factory
Apache Kafka
Sugarcrm
Wordpress
Ibm Midrange
Calendar
Hive
Path
Compression
Mapping
Webstorm
Orientdb
Flash
Animation
C# 3.0
Floating Point
Websocket
Jsf
Encryption
Silverlight
Arm
Cocoa Touch
Gremlin
Telegram
Asp.net Mvc 4
Antlr4
Android Layout
Windows Phone 8.1
Opencv
Content Management System
Artifactory
Io
Csv
Jwt
Version Control
Asp.net Mvc 5
Terminal
Sitecore
Keycloak
Struct
Twitter Bootstrap
Matplotlib
C++
Post
Big O
Memory Management
Menu
Fonts
Sails.js
Zend Framework
Webview
Hybris
Safari
Bison
Java 8
Ipad
Doctrine Orm
Eclipse Plugin
Unicode
Openerp
Deep Learning
Logging
Google Calendar Api
Google Analytics
Ipython
Compiler Errors
Asp Classic
Kotlin
Vhdl
Asp.net Core Mvc
Reference
Linux
Session
Build
Jaxb
D
Xamarin
Docker
Rdf
Tabs
Chart.js
Nginx
Xampp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网