Python 如何考虑省略号的出现来计算句子_Python_Regex - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/regex/19.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何考虑省略号的出现来计算句子_Python_Regex - Fatal编程技术网

Python 如何考虑省略号的出现来计算句子

python regex

Python 如何考虑省略号的出现来计算句子,python,regex,Python,Regex,我编写了以下脚本来计算文本文件中的句子数： import re filepath = 'sample_text_with_ellipsis.txt' with open(filepath, 'r') as f: read_data = f.read() sentences = re.split(r'[.{1}!?]+', read_data.replace('\n','')) sentences = sentences[:-1] sentence_count = len(sente

我编写了以下脚本来计算文本文件中的句子数：

import re

filepath = 'sample_text_with_ellipsis.txt'

with open(filepath, 'r') as f:
    read_data = f.read()

sentences = re.split(r'[.{1}!?]+', read_data.replace('\n',''))
sentences = sentences[:-1]
sentence_count = len(sentences)

但是，如果我在包含以下内容的

sample\u text\u上运行它，则使用_ellipsis.txt

：

Wait for it... awesome!

我得到的是

语句\u count=2

而不是

，因为它不会忽略省略号（即“…”）

我在正则表达式中尝试的是通过

{1}

使它只匹配一个句点的一次出现，但这显然不是我想要的方式。如何让正则表达式忽略省略号？

用这样的正则表达式拆分句子是不够的。请参阅了解如何利用NLTK实现这一点

回答你的问题，你称3点序列为省略号。因此，您需要使用

[!?]+|(?<!\.)\.(?!\.)

用这样的正则表达式拆分句子是不够的。请参阅了解如何利用NLTK实现这一点

回答你的问题，你称3点序列为省略号。因此，您需要使用

[!?]+|(?<!\.)\.(?!\.)

根据Wiktor关于使用NLTK的建议，我还提出了以下替代解决方案：

import nltk
read_data="Wait for it... awesome!"
sentence_count = len(nltk.tokenize.sent_tokenize(read_data))

这将产生预期的1个句子计数。

根据Wiktor关于使用NLTK的建议，我还提出了以下替代解决方案：

import nltk
read_data="Wait for it... awesome!"
sentence_count = len(nltk.tokenize.sent_tokenize(read_data))

这将产生预期的句子计数1。

是

等待它。。。太棒了被认为是一句话还是两句话？re.split（r'）（？是等它…太棒了！
被认为是一句话还是两句话？re.split（r'）（？




[regex]相关文章推荐



                                                        
                                       





随机文章推荐



                                                        
Twig 通过多个模板传递块
twig 
调用Twig中的静态函数
twig 
Twig Yii2-向细枝注册资产
twigyii2 
Twig 用细枝将文本分成两段
twig 
Twig 将body类添加到Drupal 8中的节点
twig 
Twig 小枝和；意外的T“U函数”；返回hostmonster.com的服务器500错误
twig 
Twig 如何为GRAV CMS创建全局内容
twigyaml 
Twig Symfony3细枝资产分析错误
twigsymfony 
Twig 块的细枝getSource
twig 
如何在Drupal 8中获得page.html.twig内的图像集？
twig 
Twig 细枝中的三元级联
twig 
Twig html_实体_细枝解码（opencart）
twigopencart 
Twig 如何隐藏网页，使其不显示在细枝中
{%extends'布局。主“%”
{%block page_title'关于我们“%”
{%block page_description'说明'%}
{%block headMeta%}
{{parent（）}}
{%endblock%}
{%block content%}
twig 
Twig 在Shopware 6 administration中，是否可以通过两个单独的插件两次扩展同一个细枝模板？
twig


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 查找并替换特定块中的版本
									Python
							 									Sed
							 
Python Nose在目录中收集测试
									Python
							 
Python 创建保持状态的动态函数
									Python
							 
规范请求\n Python 3
									Python
							 
Python 将字典键另存为变量
									Python
							 									Dictionary
							 
python中的链表理解
this=rand（100,3,4）
对于范围（0100）内的i：
对于范围（0,3）内的j：
对于范围（0,4）内的k：
如果在我看来，您最好使用内置的numpy例程，例如
导入numpy
>>>导入numpy.random
>>>x=numpy.random.rand（100,3,4）
>>>掩码=numpy.random.rand（*x.shape）
>>>结果=numpy.其中（掩码>>导入numpy.random
>>>x=numpy.random.rand（1
									Python
							 									Numpy
							 
为什么会出现Python索引错误？
									Python
							 									Numpy
							 
Python django 1.8和xFF1A；XView缺少一个查询集。定义XView.model，XView.queryset，
									Python
							 									Django
							 									Database
							 
Python pandas read_csv未将字符串转换为日期
									Python
							 									Date
							 									Csv
							 									Pandas
							 
SSLError:不是目录
我在Mac OS上的C++应用程序中使用了Python 2.7的嵌入式版本中的优秀请求>代码>模块。我的代码在我的Mac电脑上运行良好，但在客户机上运行不好。他使用的是Python和C++主机应用程序的相同版本。他在以下URL中遇到的错误是：
http://www.hantmade.com/backstage/thumb/1450544739_Impression%20XL%20300%20RZ.stage.png

Traceback (most recent 
									Python
							 									Macos
							 									Python 2.7
							 									Ssl
							 
在Python中选择比例的范围限制
									Python
							 									List
							 
Python：将numpy数组（int）写入二进制文件而不填充
									Python
							 									Python 2.7
							 									Numpy
							 									Io
							 									Binary
							 
Python 随机整数、计算和表格
									Python
							 									Loops
							 
Python 在Tensorflow C+中为占位符张量输入值+；美国石油学会
									Python
							 									C++
							 									Machine Learning
							 									Tensorflow
							 									Deep Learning
							 
Python Flask:服务器对内部API访问没有响应
									Python
							 									Rest
							 									Api
							 									Flask
							 
无法在AIX服务器上安装Python3
									Python
							 									Server
							 									Installation
							 
如何利用Flask为python应用程序构建GUI-（如何在Flask中运行后台任务？）
									Python
							 									Web
							 									Flask
							 									Server
							 
Python 前两个主成分是相反的
									Python
							 									Image Processing
							 									Geometry
							 
Python 计算机查找非负整数组合的最快方法x_1<=x_2<；=<；=x_n和总和为100
									Python
							 									Loops
							 									Optimization
							 
Python 使用理解更新dataframe列
									Python
							 
Python 未从自制模块中定义名称
									Python
							 									Python 2.7
							 									Class
							 									Module
							 									Raspberry Pi
							 
Python 数据科学模型达到了非常高的、出乎意料的精确度？
									Python
							 									Machine Learning
							 									Scikit Learn
							 
Python 如何使用soup从页面中提取列中的数据
									Python
							 
Python 将数据帧中的列移动到大数据帧中最后一列的最佳方法
									Python
							 									Pandas
							 									Dataframe
							 
Python 基于最小/最大值的Numpy动态数组切片
									Python
							 									Arrays
							 									Numpy
							 
Python pip安装uwsgi失败，错误为/usr/local/include/string/string.h:7:10:致命错误：'；sstream&x27；找不到文件？
									Python
							 									C++
							 									Macos
							 									Python 2.7
							 									Pip
							 
Python 重新排序初始迁移操作
									Python
							 									Django
							 									Migration
							 
用python读取vtk文件的结构
									Python
							 
Python中的ElasticNetCV与R中的cvglmnet
									Python
							 									R
							 									Machine Learning
							 
Python 查找数据帧中最频繁的组合
									Python
							 									Pandas
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Monitoring
Matplotlib
Camera
Mercurial
Asp.net Web Api
Twilio
Rss
Perl
Liferay
Deep Learning
Jquery Plugins
Charts
Cmd
React Native
Intellij Idea
Datatables
Postman
Inno Setup
Pointers
Mips
Combobox
Winforms
Erlang
Nsis
Cron
Woocommerce
Asp.net Mvc 3
Sharepoint 2013
Encryption
Phpmyadmin
Gstreamer
Pine Script
Svn
Web Services
Hash
Install4j
Ruby On Rails 3.2
Spotify
Docker Compose
Ocaml
Sparql
Floating Point
Vuejs2
Bootstrap 4
Stripe Payments
Asp.net Mvc 2
Apache2
Ms Word
Mpi
Ip
Uml
Mono
Osgi
Next.js
Speech Recognition
Vbscript
Acumatica
Google App Engine
Flash
Prometheus
Language Agnostic
Sap
Oauth 2.0
Mongoose
Oop
Gwt
Visual Studio 2012
Class
Visual Studio 2010
Automated Tests
Dotnetnuke
Sharepoint 2007
Struts2
Vaadin
Maps
Jsf 2
Java Me
Java
Azure Devops
Gitlab
Wordpress
Soap
Push Notification
Network Programming
Gdb
Cobol
Activerecord
Html
Azure Cosmosdb
Angular6
Xamarin.android
Spring Integration
Listview
Heroku
E Commerce
Json
Amazon S3
Build
Grails
Jersey
Nlp
Less
Omnet++
Apache
Usb
Ldap
Google Drive Api
.net Core
Compiler Construction
Opencl
Bash
Visual C++
Google Plus
Jetty
Assembly
Methods
Excel
Kibana
Ibm Midrange
Windows
Chart.js
Menu
Apache Spark
Actions On Google
Asp Classic
String
Scripting
Azure Data Factory
Linux
Design Patterns
Navigation
Audio
Plot
Continuous Integration
Air
Jira
Verilog
Css
Ubuntu
Openlayers 3
Weblogic
Ibm Cloud
Lotus Notes
Keyboard
Puppet
Latex
Ionic Framework
C# 3.0
Scroll
Events
Swift3
Linq To Sql
Youtube Api
Jvm
Documentation
Sql Server 2008
Mongodb
Database Design
Google Chrome Extension
Qt4
Timer
Generics
Haskell
Pentaho
C#
Office365
Notifications
Office Js
Applescript
Google App Maker
Virtual Machine
Laravel 5
Raspberry Pi
Wxpython
Nestjs
C# 4.0
Seo
Computer Science
Moodle
Visual Studio 2017
Windows Store Apps
Actionscript 3
F#
Nunit
Windows Services
Lambda
Gmail
Vim
Flutter
Xcode
Ios5
Pytorch
Sip
Extjs
Postgresql
Influxdb
Asp.net Mvc 5
Apache Camel
Express
Types
Snowflake Cloud Data Platform


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网