Python 处理NLTK Stanford POS标记器输出_Python_Nltk_Stanford Nlp - Fatal编程技术网

Python 处理NLTK Stanford POS标记器输出

python stanford-nlp

Python 处理NLTK Stanford POS标记器输出,python,nltk,stanford-nlp,Python,Nltk,Stanford Nlp,我正在使用NLTK Stanford Pos Tagger和我自己的模型来标记文本文件中的句子行。我的标记器的输出如下所示： sentences = [((Word,WordTag),....(Word,WordTag)] Im处理印尼语，在完成Pos标记后，Im执行2步：停止字删除堵塞我在文本文件（stopword.txt）中有一个stopword列表，并对句子进行词干处理。到目前为止，我已经完成了标记部分。我不知道如何在句子中过滤单词，如果在stopword.txt中删除单词，并在

我正在使用NLTK Stanford Pos Tagger和我自己的模型来标记文本文件中的句子行。我的标记器的输出如下所示：

sentences = [((Word,WordTag),....(Word,WordTag)]

Im处理印尼语，在完成Pos标记后，Im执行2步：

停止字删除

堵塞

我在文本文件（

stopword.txt

）中有一个stopword列表，并对句子进行词干处理。到目前为止，我已经完成了标记部分。我不知道如何在

句子中过滤单词，如果在stopword.txt中删除单词，并在句子中干掉单词
到目前为止，我已尝试使用以下代码删除该单词，但仍然没有删除该单词及其单词标记：
stopWords = getStopWordList('id_stopword.txt')
filtered_sentences = [w for w in sentences if not w in stopWords]
    filtered_sentences = []
    for w in sentences:
        if w not in stopWords:
            filtered_sentences.append(w)

我必须假设函数getStopWordList（）
正确返回字符串列表。（你证实了吗？）
您发布的代码不会运行，因为它有缩进错误。但是缩进的部分并不重要，因为你不需要它。很明显，它只是重复前面这行的逻辑。所以我忽略了它
要进行筛选，您需要更改以下内容：
filtered_sentences = [w for w in sentences if not w in stopWords]

为此：
filtered_sentences = [(w,t) for (w,t) in sentences if not w in stopWords]

是的，getStopWordList（）返回字符串列表。非常感谢。现在剩下的问题是堵塞。我可以用下面的代码对过滤后的句子进行词干分析吗。你的代码没有进入你的评论。可能太长了。




[spring cloud]相关文章推荐



                                                        
Spring cloud Spring Cloud Sidecar负载平衡失败时不重试
spring-cloud 
Spring cloud 如何使用Spring配置服务设置本地配置属性
spring-cloud 
Spring cloud 如何从Spring云配置服务器读取多个配置文件
spring-cloud 
Spring cloud 使用Spring云配置未获得加密值？
spring-cloud 
Spring cloud 使用Spring Cloud Data Flow 2.0.1时获取Oracle 11.2不支持的错误
spring-cloud 
Spring cloud 跳过返回http URL的https rest端点请求
spring-cloud 
Spring cloud 如何使用SpringCloudStream3.x'；什么是新的功能绑定样式？
spring-cloud 
Spring cloud 如何设置rockemq消息过期时间？
spring-cloud 
                                       





随机文章推荐



                                                        
Generics 为什么'；示例编译时，即（协方差、反方差和内方差）是如何工作的？
genericsscala 
Generics .net远程处理-列表问题<；T>；
generics 
Generics 如何比较C#3.0中的两个通用列表？
genericsc#-3.0 
Generics 结构图2.6.1，一个IRepository<；T>；和一个eForepository<；T、 T上下文>；
generics 
Generics 类型级编程中的协方差
genericsscalatypes 
Generics 类型参数支持添加的泛型接口
genericsf# 
使用GHC.Generics反序列化
genericshaskell 
Generics Haskell中基于某些谓词的泛型函数结果
genericshaskelltypes 
Generics 两个类或结构的泛型函数
genericsswift 
Generics Swift：泛型树
genericsswifttree 
Generics 使用Dart'；带泛型的s call（）方法
genericsdart 
Generics 泛型类型的WebApi2 ResponseType属性
genericsasp.net-web-api 
Generics 如何解决静态解析类型参数的递归映射中的奇怪类型错误？（第2部分）
genericsf# 
Generics 将成员约束添加到内联函数的参数会导致数组访问器上出现FS0752
genericsf# 
Generics 通过反射的Kotlin数据类实例
genericskotlinreflection 
Generics 如何强制客户端代码使用合同初始化Kotlin中所有必需的生成器字段？
genericskotlin 
Generics 这是kotlin'；在'；关键词？
genericskotlin 
Generics 锈蚀：E0562，在实施通用特性时
genericsrust 
Generics 通用SwiftUI视图的字符串推断协议
genericsviewswiftui 
Generics 带Get的Ada模糊表达式
genericsada


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python-从html获取文本
									Python
							 									Html
							 									Text
							 
python中的二进制搜索程序出错
									Python
							 
Python {“错误”：[{“消息”：“无法验证您的身份”，“代码”：32}]
									Python
							 									Oauth
							 									Twitter
							 
Python 分析具有未知分隔符的行
									Python
							 									Parsing
							 									Date
							 
Python 从CSV文件中获取数据并将其转换为变量
									Python
							 									Csv
							 									File Io
							 
在python中检索二维字典的唯一键（第二维）？
									Python
							 									Arrays
							 									Dictionary
							 
将Python列表转换为Numpy结构化数组？
									Python
							 									Arrays
							 									Numpy
							 
Python Django反向关系
									Python
							 									Django
							 
Python django多语言和模板端语言之间的切换
									Python
							 									Linux
							 									Django
							 
在Python中下载URL而不使用urllib
									Python
							 									Html
							 
Python 以两种方式打印对象的属性
									Python
							 									Class
							 									Oop
							 
Python：导入类的实例但接收字节码
									Python
							 									Import
							 
Python 合并数据帧会复制一些数据
									Python
							 									Pandas
							 									Merge
							 
Python 如何检查多对多字段中是否存在Django用户？
									Python
							 									Django
							 
Python AWS使用textract启动文档分析不工作
									Python
							 									Amazon Web Services
							 									Aws Lambda
							 
Python 加载预训练模型时的权限错误，Django，AWS
									Python
							 									Django
							 									Amazon Web Services
							 									Deep Learning
							 
使用列表中的匿名函数在python中处理清理操作
									Python
							 									List
							 
如何将值动态添加到python dict中，然后添加到JSON文件中？
									Python
							 									Json
							 									Python 3.x
							 									Dictionary
							 
Python 在数据库中使用查询从SQL表中删除记录
									Python
							 									Pandas
							 
Python 如何用一个命令生成所需的所有性感字段？
									Python
							 									Json
							 									Python 3.x
							 
如何捕获实时请求url'；使用python，使用selenium将
									Python
							 									Python 3.x
							 									Selenium
							 									Selenium Webdriver
							 
Python Discord.py AttributeError:“不一致”；“用户”；对象没有属性“；公会；
									Python
							 									Python 3.x
							 									Discord
							 
Python 使用asyncio，等待所有结果并将其返回的最简单方法是什么？
									Python
							 
Python 获取属性错误：模块'；速度测试'；没有属性'；速度测试'；
									Python
							 									Jupyter Notebook
							 
Python 索引器：索引4超出大小为4的轴0的界限
									Python
							 									Numpy
							 
Python 查找最接近0的值的索引时出错
									Python
							 									Arrays
							 									Numpy
							 
Python 如何展平以下元组
									Python
							 									Python 3.x
							 									List
							 
Python 如何在字符串列中执行计算
									Python
							 									Pandas
							 									String
							 
Python 使用不同参数时生成的重复数据
									Python
							 									Function
							 
Python 如何从给定的概率分布中取样？
									Python
							 									Random
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Teradata
Java 8
Multithreading
Umbraco
Language Agnostic
Plugins
Mule
Dynamic
Validation
Xamarin
Ip
Entity Framework Core
Active Directory
Angular6
Nunit
Asp.net Mvc 4
Gitlab
Google Maps
Unity3d
Webrtc
Content Management System
Cordova
Matlab
Jira
Telerik
Deep Learning
Geometry
Android Studio
Perforce
Report
Localization
Internet Explorer
Webstorm
Certificate
Meteor
Gruntjs
Scrapy
Solr
Kentico
Erlang
Adobe
Cmake
Pip
Cakephp
Artifactory
Gradle
C#
Keras
Neo4j
Twitter Bootstrap
Vaadin
Sql Server 2008
Artificial Intelligence
Matplotlib
Security
Sequelize.js
Serial Port
Version Control
Aem
Google Cloud Dataflow
Aws Lambda
Winapi
Jsp
Tags
Generics
Webpack
Visual Studio
Puppet
Hyperledger Fabric
Nsis
Extjs
Cygwin
Drools
Wicket
Delphi
Nestjs
Charts
Xmpp
Clojure
Loopbackjs
Http
Sublimetext3
Domain Driven Design
Eclipse Plugin
Mono
Jdbc
.net
Spring
Geolocation
Passwords
Parse Platform
Design Patterns
Smalltalk
Oracle11g
Makefile
Google Visualization
Socket.io
C++
Forms
Single Sign On
Swing
Binding
Flask
Computer Vision
Postman
Join
Servlets
Junit
Encryption
Lisp
Electron
Netty
Titanium
Flash
Ubuntu
Xcode
Uml
Firebase
Cron
Deployment
Ms Word
Jwt
Installation
Stored Procedures
Ldap
Ember.js
Codeigniter
Mongoose
Graphviz
User Interface
Openshift
Selenium
Javafx
Data Binding
Openerp
Usb
Nginx
Struct
Twilio
Neural Network
Windows Mobile
Plsql
Uitableview
Wix
Uiview
Docker
Gatsby
Twig
Blackberry
Autodesk Forge
Powerbi
Playframework 2.0
Ftp
Testing
Qt
Calendar
Path
Spring Boot
Architecture
Weblogic
Appium
Bots
Ffmpeg
Perl
Heroku
R
Gnuplot
Svg
Sbt
Object
Knockout.js
Ignite
React Native
Objective C
Apache Zookeeper
Sonarqube
Google App Engine
Express
Powershell
Sip
Ios6
Latex
Autocomplete
Apache Spark
Vue.js
Glassfish
Phpstorm
Linux Kernel
Identityserver4
Jestjs
Ocaml
For Loop
Macos
Oauth
Unicode
Nativescript
Vim
Jakarta Ee
Android Fragments
Logging
Google Analytics


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网