在从文件加载的字上使用R中tm_映射中的RemoveWords_R_Tm - Fatal编程技术网

在从文件加载的字上使用R中tm_映射中的RemoveWords

r

在从文件加载的字上使用R中tm_映射中的RemoveWords,r,tm,R,Tm,在R的tm_map包中，我看到了一些关于使用removewords函数从语料库中删除stopwords（）或硬编码单词的问题。但是，我正在尝试删除存储在文件中的单词（当前为csv，但我不在乎是哪种类型）。使用下面的代码，我没有得到任何错误，但我的话仍然存在。有人能解释一下怎么了吗 #install.packages('tm') library(tm) setwd("c://Users//towens101317//Desktop") problem_statements <- read

在R的

tm_map

包中，我看到了一些关于使用

removewords

函数从语料库中删除

stopwords（）

或硬编码单词的问题。但是，我正在尝试删除存储在文件中的单词（当前为csv，但我不在乎是哪种类型）。使用下面的代码，我没有得到任何错误，但我的话仍然存在。有人能解释一下怎么了吗

#install.packages('tm')
library(tm)

setwd("c://Users//towens101317//Desktop")

problem_statements <- read.csv("query_export_results_100.csv", stringsAsFactors = FALSE, header = TRUE)
problem_statements_text <- paste(problem_statements, collapse=" ")
problem_statements_source <- VectorSource(problem_statements_text)

my_stop_words <- read.csv("mystopwords.csv", stringsAsFactors=FALSE, header = TRUE)
my_stop_words_text <- paste(my_stop_words, collapse=" ")

corpus <- Corpus(problem_statements_source)
corpus <- tm_map(corpus, removeWords, my_stop_words_text)

dtm <- DocumentTermMatrix(corpus)
dtm2 <- as.matrix(dtm)

frequency <- colSums(dtm2)
frequency <- sort(frequency, decreasing=TRUE)

head(frequency)

#install.packages（'tm'））
图书馆（tm）
setwd（“c://Users//towens101317//Desktop”）
问题陈述你能在tm地图行之前添加一个对inspect（语料库）的调用吗？这样我们就可以看到你的语料库是什么样子了？难道语料库中的最后一个参数不应该吗？问题是read.csv（）创建了一个表，但我需要一个向量。函数的作用是：。我像这样改变了我的阅读声明，它成功了




[camera]相关文章推荐



                                                        
Camera 如何在ROWLEX中使用相机本体
camera 
Camera 如何用微控制器从照相机中获取单屏幕快照
camera 
Camera 实际应用中需要计算或已知的基本矩阵
cameracomputer-vision 
Camera 摄像头远程API beta SDK：如何同步多个DSC QX 100摄像头
camera 
Camera LibGDX相机位置随移动而移动
cameralibgdx 
Camera USB多路电缆
camera 
Camera 虚拟现实环境中的实时流媒体模型
camera 
Camera HTML Javascript照相机捕获
camera 
Camera 在Maxscript中设置FOV
camera 
Camera Can'；在电影院4D R18中找不到相机舞台
camera 
Camera 如何使用phonegap framework7模板访问相机并拍照？
camera 
Camera 360度相机的内在参数？
camera 
Camera 可以通过CAN总线发送jpg文件吗
camerausbstm32 
                                       





随机文章推荐



                                                        
Directory 更改“中的输出目录”；sbt本机包装机“；
directorysbtmapping 
Directory Python3.x：导入函数、配置字典。。。从不同目录中的文件等
directorypath 
Directory 如何创建新目录？
directory 
Directory 找到0.000文件夹，dir0000.chk文件夹
directory


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
使用facet_grid（）设置两个因变量的y轴限制
									R
							 
R 在一个图中绘制两个条件
									R
							 									Plot
							 
r中列差异的for循环
									R
							 									Loops
							 
我的R for循环有什么问题？矩阵存取简化为向量存取
									R
							 									For Loop
							 
R-未正确输入的清洁编号
									R
							 
在R中的列表上执行*应用
									R
							 									List
							 
等待子进程在R中终止
									R
							 
在不使用for循环的情况下重新标记多列标签属性
									R
							 
R 从另一个数据帧向绘图添加线
									R
							 
R 如何在同一图形中绘制两条条形图
									R
							 
R调整R平方多个自变量
									R
							 
macOS上的rJava存在问题
									R
							 
R 组合多个观测值的矢量化方法
									R
							 									Loops
							 									Dataframe
							 
R 在Expss中使用文本时，如何使自定义表显示显著差异？
									R
							 
R 政府影响及；虚拟编码；sjPlot&；优势比
									R
							 
如何在igraph包的visIgraph中制作的图形中添加带有过滤器颜色的标题？
									R
							 
如何使用levelplot（LatticeExtra）在单个地图中绘制其他字段？
									R
							 									Maps
							 
希望通过随机化将一个思维实验翻译成R代码
									R
							 
如何使r中非常小的数字精确到零？
									R
							 
如何从R项目中删除纸条
									R
							 
使用（ref:foo）格式化bookdown定理环境标题（例如，示例）
									R
							 
R：如何在RSSL中输出逻辑回归的预测概率
									R
							 									Machine Learning
							 
R 变量长度在具有NA值的回归循环中不同
									R
							 									Dataframe
							 									Loops
							 									Variables
							 
R 基于条件打印字符向量的某些元素并删除其他元素
									R
							 									If Statement
							 									Vector
							 
将绘图插入（子绘图）和多个标准偏差添加到ggplot（），并根据R中的条件进行过滤
									R
							 
R 如何制作一个很好的可复制的例子
									R
							 
R 自动循环和打印带有颜色的矩形
									R
							 									Loops
							 									Plot
							 
R 将df管道化为几何参数
									R
							 
r：如何在应用程序上放置可下载的PDF
									R
							 									Shiny
							 
R 使用列表查找列表在第二个列表中查找高于阈值的值并对其进行量化
									R
							 									List
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Sqlalchemy
Testing
Azure Devops
Discord.py
Stored Procedures
Ravendb
Canvas
Amazon Ec2
Appium
Apache Flex
Amazon Web Services
Triggers
Data Structures
Open Source
Windows Services
Fluent Nhibernate
Linux
Swing
F#
Filter
Recursion
Matrix
Search
Less
Multithreading
Macros
Graphics
Pandas
Logstash
Abap
Netty
Vagrant
Graphviz
R
React Native
Express
Button
Ssrs 2008
Subsonic
Cuda
Emacs
Ruby
Cmake
Fortran
Jdbc
Json
Sql Server 2008
Mariadb
Ms Word
Xamarin.forms
Audio
Primefaces
Mapping
Memory Leaks
Sockets
Unity3d
Synchronization
Visual Studio 2013
Titanium
Microservices
Hash
Silverstripe
Html5 Canvas
Lisp
Jetty
Url Rewriting
Apache Pig
Colors
Python Sphinx
Openerp
Amazon S3
Nest
Nginx
Log4net
Android Layout
Google Cloud Firestore
Plugins
X86
Model
Typo3
Spotify
Certificate
Computer Science
Itext
Aframe
Spring Integration
Sharepoint 2013
Permissions
Fullcalendar
Ruby On Rails
C# 3.0
Vaadin
Moodle
Scala
Virtualbox
Assembly
Datatables
Chef Infra
Camera
Dojo
Google Visualization
Firefox
Tags
Jar
Templates
Erlang
Amazon Cloudformation
Module
Requirejs
Kentico
Apache Kafka
Drop Down Menu
Compilation
Sphinx
Objective C
Serialization
Dynamic
Actionscript 3
Tcl
Autodesk Forge
Weblogic
Selenium
Jakarta Ee
Binding
Curl
Ionic2
Activerecord
Amp Html
Identityserver4
Salesforce
Tinymce
Logic
Telegram
Uitableview
Download
Sorting
Mercurial
Monitoring
Operating System
Windbg
Cocoa
Debugging
Google Apps Script
Google Calendar Api
C#
Autocomplete
Arangodb
Verilog
Jquery Mobile
Openstack
Time Complexity
Process
Openid
Docker
Octave
Oracle10g
Google Chrome
Sugarcrm
Parameters
Import
Vba
Arduino
Ibm Midrange
File Upload
Wxpython
Ios7
Wolfram Mathematica
Zsh
Web Applications
Fonts
Unit Testing
Iphone
Codenameone
Sms
Report
Orientdb
Navigation
Ubuntu
Class
Mongodb
Orchardcms
Bootstrap 4
Markdown
Xaml
Sitecore
Css
Stripe Payments
Sublimetext3
Vue.js
Cucumber
Resharper
Groovy
Coding Style
Imagemagick
Ajax
Core Data
Knockout.js
Bluetooth
Database Design
Amazon Redshift
Mule


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网