Python 删除停止字和字符串。标点符号_Python_Nltk_Punctuation - Fatal编程技术网

Python 删除停止字和字符串。标点符号

python

Python 删除停止字和字符串。标点符号,python,nltk,punctuation,Python,Nltk,Punctuation,我不明白为什么这不起作用： import nltk from nltk.corpus import stopwords import string with open('moby.txt', 'r') as f: moby_raw = f.read() stop = set(stopwords.words('english')) moby_tokens = nltk.word_tokenize(moby_raw) text_no_stop_words_punct

我不明白为什么这不起作用：

import nltk
from nltk.corpus import stopwords
import string

with open('moby.txt', 'r') as f:
    moby_raw = f.read()
    stop = set(stopwords.words('english'))
    moby_tokens = nltk.word_tokenize(moby_raw)
    text_no_stop_words_punct = [t for t in moby_tokens if t not in stop or t not in string.punctuation]

    print(text_no_stop_words_punct)

从输出来看，我有以下几点：

[...';', 'surging', 'from', 'side', 'to', 'side', ';', 'spasmodically', 'dilating', 'and', 'contracting',...]

看来标点符号还在那儿。我做错了什么？

在这一行中，请尝试将“或”改为“和”，这样您的列表将只返回既不是停止词也不是标点符号的单词

text_no_stop_words = [t for t in moby_tokens if t not in stop or t not in string.punctuation]

在这一行中，尝试更改“或”到“和”，这样列表将只返回既不是停止词也不是标点符号的单词

text_no_stop_words = [t for t in moby_tokens if t not in stop or t not in string.punctuation]

它必须是

和

，而不是

或

：

if t not in stop and t not in string.punctuation

或：

或：

后一种解决方案是最快的。

它必须是

和，而不是或：
if t not in stop and t not in string.punctuation

或：
或：
后一种解决方案最快。关闭。
您需要在比较中使用和
而不是或。
如果像“；”这样的标点符号不在stop
中，那么python不会检查它是否在字符串中
text_no_stop_words_punct = [t for t in moby_tokens if t not in stop and t not in string.punctuation]

接近。
您需要在比较中使用和
而不是或。
如果像“；”这样的标点符号不在stop
中，那么python不会检查它是否在字符串中
text_no_stop_words_punct = [t for t in moby_tokens if t not in stop and t not in string.punctuation]




[layout]相关文章推荐



                                                        
Layout 乳胶中的浮子和图片问题
layoutlatex 
Layout 如何在vim中交换两个打开文件（拆分）的位置？
layouteditorvim 
Layout Symfony：如何在没有布局的页面中加载.css？
layoutsymfony1 
如何使用TileLayout将数据组中的单元格底部对齐？
layout 
Layout MVC 3布局和控制器
layoutasp.net-mvc-3razor 
Layout 开源电子商务解决方案
layoutopen-sourcee-commerce 
Layout 具有非叶节点自定义值的d3层次结构布局
layouttreed3.js 
Layout 当我在panelGrid中放置两个饼图时，它们就消失了
layoutprimefacescharts 
Layout Hybris自定义布局页面
layoutcontent-management-systemhybris 
根据Firemonkey中标签的数量调整TLayout的大小
layout 
Layout 本体图布局算法（有向无环图）
layoutgraph 
Layout 如何在没有'的情况下优化布局；面积'；igraph中的选项？
layout 
Layout PDFBox布局：向StyledText添加换行符
layout 
Layout 将固定小部件放在TabBarView上方
layoutdartfluttertabs 
Layout 在nativescript中，一个页面上的多个布局是否不好？如果是，为什么？
layoutnativescript 
                                       





随机文章推荐



                                                        
Layout Silverlight内容显示在HTML内容的顶部
layoutsilverlight-4.0 
Layout CWinAppEx CleanState-重置布局
layoutmfc 
Layout 在面板extjs 4中布局按钮
layoutbuttonextjsextjs4 
Layout JavaFX VBox和HBox布局
layoutjavafx-2 
Layout 使用此.setItems（）动态构建容器
layoutsencha-touch-2 
Layout 在orchard中选择同一主题中的其他布局
layoutorchardcms 
Layout Windows Phone 4.3中的布局不同”；WVGA
layoutwindows-phone-8.1windows-store-apps 
Layout JavaFXGridPane：展开按钮以填充多个单元格
layoutjavafx 
Layout Rails为相同的操作设计不同的邮件器布局
layout 
Layout Vaadin:HorizontalSplitPanel中没有水平滚动条
layoutvaadin


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python Mac 10.6通用二进制scipy:cephes/specfun“_aswfa“；找不到符号
									Python
							 									Architecture
							 
在python文件中写入utf-8字符串
									Python
							 									Unicode
							 									Utf 8
							 
如何解析代码（在Python中）？
									Python
							 									Parsing
							 									Data Structures
							 
Python 在Google App Engine上在线生成CSV文件
									Python
							 									Google App Engine
							 									Csv
							 
使用Python在Mac OSX中转义正斜杠路径目录？
									Python
							 									Path
							 									Directory
							 
Python 不带类的属性方法
									Python
							 									Class
							 									Properties
							 
用Python批量编辑csv文件
									Python
							 									Csv
							 									Scripting
							 
Python：如何从文本文件创建点形状文件
									Python
							 
Python：用括号格式化负数
									Python
							 
Python Yowsup WhatsApp获取电话号码
									Python
							 
在Python中将多个返回值追加到不同的列表
									Python
							 									List
							 									Performance
							 
Python 如何在循环内的字典中的键中添加值？
									Python
							 									List
							 									Dictionary
							 
Python 我的代码的递归不'；即使我把所有的东西都退了，我也似乎不起作用
									Python
							 									Function
							 									Recursion
							 
如何创建元组的元组，并在python中分配变量
									Python
							 									List
							 
Python 如何使用炼金术实现多对多关系？
									Python
							 									Sqlalchemy
							 
是什么导致我的条件[Python]中出现缩进错误
									Python
							 
Python 使用while循环运行以下代码时出现语法错误
									Python
							 
Python 在日志文件中拆分行
									Python
							 									Python 3.x
							 									Python 2.7
							 
Python cv2.0错误：OpenCV（4.3.0）输入图像中的通道数无效
									Python
							 									C++
							 									Opencv
							 
如何将字典转换回python中的txt文件？
									Python
							 
Python 将两列合并为列表数据类型，并从json文件中过滤出单词
									Python
							 									Python 3.x
							 									Pandas
							 									List
							 
在python类中，如何从同一类的另一个方法调用该类的非实例方法？
									Python
							 									Oop
							 
使用Python从站点获取实时日期（例如天气预报）
									Python
							 									Websocket
							 
Python 如果元素是元组，则numpy find mean
									Python
							 									Numpy
							 
Python 循环浏览列表时处理错误
									Python
							 
Python 逐行读取和打印网站url中的文本文件
									Python
							 									Python 3.x
							 									Url
							 									Text
							 
Python-命令行参数中的尖括号
									Python
							 
Python 替换字符串中的多个空格后正则表达式字符串不匹配
									Python
							 									Regex
							 									String
							 
Python 使用RegEx修改文本文件后，如何下载新修改的文件？
									Python
							 									Download
							 									Google Colaboratory
							 
Python Flask，使用表单输入作为全局变量，使用表单提交作为输入执行自定义ETL模块，然后在完成后显示图表
									Python
							 									Flask
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Alfresco
Logging
Soap
Cmake
Go
Aws Lambda
Ip
Search
Haskell
Signalr
Webpack
Web Scraping
Fullcalendar
C++
Android Studio
Sql Server 2008 R2
Sugarcrm
Xamarin
Entity Framework 4
Octave
Compression
Mediawiki
Three.js
Material Ui
Perforce
Github
Resharper
Neural Network
Cakephp
Composer Php
Blackberry
D
Apache Kafka
Libgdx
Checkbox
Google App Maker
Codeigniter
Vagrant
Active Directory
Process
If Statement
Tinymce
Path
Visual Studio
Ide
Project Management
Doctrine Orm
Nosql
Electron
C
Wordpress
Vaadin
Asp.net Mvc 5
Itext
Windows Store Apps
Telegram
Sharepoint
Responsive Design
Virtualbox
Netlogo
Jwt
Wix
Graphql
C# 4.0
Ember.js
Laravel
Python 3.x
Udp
Firefox Addon
Mono
Cron
Antlr4
Erlang
File Upload
Netbeans
Sapui5
Ios8
E Commerce
Charts
Ios6
Optimization
Ftp
Pentaho
Amazon Web Services
Cryptography
Atom Editor
Lucene
Batch File
Graphics
Spring Security
Database
Lisp
Mariadb
Twitter Bootstrap
Web
Glsl
Google Maps Api 3
Windbg
Mongodb
Ssas
Vmware
Sphinx
Teamcity
Linkedin
Terminal
Pagination
Snmp
Mdx
Curl
Tridion
Unit Testing
Rest
Dynamics Crm 2011
Cmd
Kendo Ui
Blazor
Cocoa
Mercurial
Google Cloud Platform
Struts2
Memory Management
Bluetooth
Ruby On Rails 3.2
Coldfusion
Django Models
Coding Style
Tomcat
Lambda
Math
Com
Content Management System
Cassandra
Grid
Drools
Windows Runtime
Mapreduce
Anaconda
Zsh
Autodesk Forge
Monitoring
Asp.net Mvc 4
Xna
Passwords
Sorting
Security
Docker Compose
Network Programming
Reporting Services
Combobox
Tsql
Windows Phone 7
Jsf 2
Scala
Angularjs
Gulp
Embedded
Windows Installer
Winapi
Scrapy
3d
Woocommerce
Layout
Spring Batch
Solr
Yocto
Install4j
Plsql
Routes
Programming Languages
Pine Script
Visual Studio Code
Json
For Loop
Cloud
Sed
Input
Matplotlib
Cocos2d Iphone
Html
Junit
Data Structures
Windows Phone 8.1
Next.js
Requirejs
Spring Integration
Activemq
Bison
Ms Office
Rdf
Jsp
Exchange Server
Oracle
Meteor
Bootstrap 4
Tfs
Sencha Touch 2
Tensorflow
Log4net
Cucumber
Wxpython
Nestjs


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网