Python 如何使用正则表达式将句子拆分为单词？_Python_Regex - Fatal编程技术网

Python 如何使用正则表达式将句子拆分为单词？

python regex

Python 如何使用正则表达式将句子拆分为单词？,python,regex,Python,Regex,“她太好了！”->[“她”、“她”、“她”、“那么”、“很好”、“很好”！] 我想这样把句子分开！所以我写了代码，但它包含空格！如何仅使用正则表达式生成代码 words = re.findall('\W+|\w+') ->[“她”、“她”、“s”、“所以”、“很好”、“很好”！] 正则表达式：在[^A-Za-z]中添加您不想匹配的字符详情： []匹配列表中的单个字符 [^]匹配列表中不存在的单个字符 +在一次和无限次之间匹配 |或 Python代码： text =

“她太好了！”->[“她”、“她”、“她”、“那么”、“很好”、“很好”！] 我想这样把句子分开！所以我写了代码，但它包含空格！如何仅使用正则表达式生成代码

        words = re.findall('\W+|\w+')

->[“她”、“她”、“s”、“所以”、“很好”、“很好”！]

正则表达式：

在

[^A-Za-z]

中添加您不想匹配的字符

详情：

```
[]
```
匹配列表中的单个字符
```
[^]
```
匹配列表中不存在的单个字符

+
在一次和无限次之间匹配

|
或

Python代码：

text = "She's so nice!" matches = re.findall(r'[A-Za-z]+|[^A-Za-z ]', text)
输出：

['She', "'", 's', 'so', 'nice', '!']

Python的
re
模块不允许在零宽度断言上拆分。您可以改用python（确保指定使用版本1，该版本正确处理零宽度匹配）

输出：
['She'，'s'，'s'，'so'，'nice'，'！']

\s+|\b（？）
匹配以下任一选项

\s+
匹配一个或多个空白字符

\b（？！^ |$）
将位置断言为单词边界，但不在行首或行尾

这不仅仅是使用正则表达式吗？你的实际计划是什么？@heemayl我想把每个单词和特殊单词分开，除了空格@WillemVanOnsem我必须删除正则表达式后面的空格！试试这个：@Amily数字呢？你如何对待数字？
['She', "'", 's', 'so', 'nice', '!']

import regex s = "She's so nice!" x = regex.split(r"\s+|\b(?!^|$)", s, flags=regex.VERSION1) print(x)

[regex]相关文章推荐

Regex 如何为ipaddress创建一个正则表达式，以便与PL SQL中的其他模式一起使用 regex plsql

Regex 正则表达式是否匹配Django URL调度程序中的负数？ regex django

Regex 将字母字符作为第一个字符与其余字母数字字符匹配的正则表达式 regex

Regex 如何从正则表达式中提取字符串？ regex

将字符串中所有匹配字符的位置与bash中的regexp匹配 regex bash

Regex 将跟踪代码添加到CSV文件每行中链接的第一个实例 regex perl

Regex 在\（反斜杠）和第一个之间获取数据的正则表达式。（dot） regex pdf syntax

Regex “的正则表达式”；乞讨；和字符总数 regex

Regex 提取R中字符串的部分 regex r

Regex 如何在文本编辑器中替换正则表达式的子字符串 regex string replace notepad++

Regex 正则表达式查找并替换为可以变化的字符 regex sed

Regex 使用“替换法”$1“；一串 regex perl

Regex mongo中不区分大小写的搜索，不带正则表达式？ regex mongodb mongoose

Regex 正则表达式匹配两个字符串之间的最后一个匹配项 regex

Regex 匹配以1结尾的编号，以11结尾的编号除外 regex awk

Regex 如何捕获其他两个组之间的可选组 regex

Regex 如何使用正则表达式替换URL的文件路径？ regex

Regex 正则表达式无法对两个匹配项使用相同的字符 regex

Regex 如何检查字符串是否只有字母字符和一个空格（Javascript） regex

Regex 在Groovy中过滤字符串并对匹配项进行处理 regex groovy

随机文章推荐

舞台灯光vs Gstreamer gstreamer

GStreamer videotestsrc到RTP gstreamer

gstreamer videotestsrc rtp不工作 gstreamer

在Android上，GStreamer中的RTSP流是不稳定的 gstreamer

GStreamer读取相机分辨率 gstreamer

使用Gstreamer编码/解码VP8或VP9？ gstreamer

纪录及；使用GStreamer将V4L2/dev/video0实时预览到H264文件 gstreamer

gstreamer的python绑定：如何导入typelib gstreamer

[python]相关推荐

Python 3.5“；找不到vcvarsall.bat“；
Python Windows

Python 如何修复CSV/JSON的Scrapy dictionary输出格式
Python Web Scraping Scrapy

不同的测试对象单独通过，但在一起运行时出错。[Python测试是否并行运行不同的测试类？]
Python Unit Testing

Python 创建序列号列表，直到下一个舍入数超过x
Python List Python 2.7

如何在Python中设置指定次数的类属性
Python

IPython:是否有%matplotlib inline"；导入matplotlib之前是否需要？
Python Matplotlib Ipython

“；字符串值不正确”；尝试通过Python和文本文件将字符串插入MySQL时
Python Mysql Utf 8

以pythonic方式获取列表中每个值的索引列表
Python Numpy

python if语句打印不正确的条件
Python Python 2.7

Python 在单词列表中查找最常用的字母
Python

Python tensorflow再培训最后一层如何处理不同的图像大小？
Python Tensorflow Deep Learning

Python 通过删除Cookie注销
Python Django Cookies

Python-如何使用变量中的值添加字典键
Python Python 3.x

Python中链接张量积的习惯用法是什么？
Python Numpy Tensorflow

Python 更改列的值
Python Pandas Csv

Python 将每个数平方为整数
Python Python 3.x

Python中列表按整数降序排序
Python List Sorting

如何在python中将两个字典列表连接在一起？
Python Arrays Dictionary

Python 如何不在最后一个元素后添加分隔符
Python

Python 比较两个字典的值'；s项目
Python Python 2.7 Dictionary

Python 无法手动安装程序包
Python Pandas Pip Pycharm

Python 当前路径product/，没有'；我一个也配不上
Python Django

Python 数值逼近向量的雅可比矩阵
Python Numpy

Python记录器适配器记录额外的键工作参数
Python Logging

Lib未从站点包卸载（Python）
Python

Python条形图竞赛列颜色
Python Matplotlib Colors

Python 如何向用户分发Django web应用程序？
Python Django Security Web Applications

Python 将csv文件读入Pycharm时出错
Python Pandas Pycharm

Python Webscraping返回变量而不是实际值
Python Web Scraping

Python 合并熊猫数据帧中的字符串时出现问题-编码问题？
Python String Pandas Encoding Merge

Tags

C# 4.0 Servlets Windows Installer Tinymce Ubuntu Linker Cors Dom Antlr4 Ecmascript 6 Knockout.js Socket.io Cypress Swift3 Smtp Asp.net Mvc Activemq Sencha Touch 2 Replace Linux Process Sip Jira Floating Point Netlogo Kubernetes Node.js Xml Join Authentication Cloud Material Ui Pip Opengl Spring Cloud Wpf Prometheus Iphone Air Gremlin Three.js Io Swift2 Rabbitmq Scikit Learn Glassfish Office365 Random Smalltalk Class Html Spring Batch Plsql Actionscript 3 Calendar Kernel Amp Html Jmeter Selenium Webdriver Coffeescript Quickbooks File Io .net 4.0 Validation Concurrency Optimization Javafx Core Data Ip Virtual Machine Forms Cassandra Graphql Recursion Filter Azure Data Factory Ibm Mq Pagination Uitableview Mapbox Log4net Verilog Clojure Tsql Appium Intellij Idea Sms Gwt Mongodb Syntax Bazel Interface Akka Visual C++ Indexing Logstash Eclipse Plugin Pytorch Jar Haskell Merge Acumatica Amazon Redshift Go Programming Languages Microservices Raspberry Pi Grid Eclipse Service Meteor Cocoa Touch Windows Store Apps Discord.js Pandas Continuous Integration Fiware Nestjs Seo Configuration Windows Runtime Groovy Vue.js Internet Explorer Applescript Silverlight Serialization Umbraco Google Bigquery Sitecore Office Js Orientdb Winapi For Loop Input Openerp Unix Ipython Nhibernate Gmail Directx Airflow Svn Google Cloud Dataflow Url Ssh Report Rx Java Version Control C# Blockchain Hive Ibm Midrange Memory Laravel 5 Erlang Time Terminal Razor Regex Character Encoding Keras Variables Jpa Python 2.7 Axapta Imagemagick Data Binding Computer Vision Typescript Prestashop View Java Me Tomcat Cmake Xamarin.ios Design Patterns Jwt Openlayers 3 Rss Twitter Iis Mapping Llvm Loops Url Rewriting Sas Xamarin.forms Cron Xpath Tridion Angular Dns Fullcalendar Asp.net Mvc 5 Maven 2 Dependency Injection Azure Sql Database Events Enums Vagrant

Copyright © 2024. All Rights Reserved by - Fatal编程技术网