String R中的字符串到字向量_String_R_Text Mining_Tm - Fatal编程技术网

String R中的字符串到字向量

string r

String R中的字符串到字向量,string,r,text-mining,tm,String,R,Text Mining,Tm,我的数据集中有40行和3个属性列。每行都是一个单独的文本文档。我使用library（tm）的TermdocumentMatrix（）函数将字符串转换为单独的术语。但该函数将属性列的数量视为文档的数量。为什么会这样？我是不是搞错了 R中是否有类似于weka的StringToWordVector过滤器的属性过滤器？我希望结果与weka的StringToWordVector过滤器相同示例如下所示： Title, Author, BookSummary The Da Vinci Code, Dan

我的数据集中有40行和3个属性列。每行都是一个单独的文本文档。我使用

library（tm）

的

TermdocumentMatrix（）

函数将字符串转换为单独的术语。但该函数将属性列的数量视为文档的数量。为什么会这样？我是不是搞错了

R中是否有类似于weka的

StringToWordVector

过滤器的属性过滤器？我希望结果与weka的

StringToWordVector

过滤器相同

示例如下所示：

Title, Author, BookSummary

The Da Vinci Code, Dan Brown, Louvre curator and Priory of Sion Grand Master Jacques<br>

标题、作者、书籍摘要
达芬奇密码，丹布朗，卢浮宫馆长和锡安大师雅克修道院

此示例仅显示一行

我尝试了以下代码：-

data<-read.csv("C:/Users/admin/Desktop/RTextMining/dataset.csv")
corpus.tmp<-Corpus(VectorSource(data))
View(corpus.tmp)

corpus.tmp<- tm_map(corpus.tmp,removePunctuation)  
corpus.tmp<- tm_map(corpus.tmp, stripWhitespace)
corpus.tmp<- tm_map(corpus.tmp, tolower)
corpus.tmp<- tm_map(corpus.tmp, removeWords, stopwords("english"))

library(SnowballC)
corpus.tmp <- tm_map(corpus.tmp, stemDocument)

TDM <- TermDocumentMatrix(corpus.tmp)

dataWhere是可复制的示例？当我们不知道数据是什么样子（选择3行）或您正在尝试的代码时，很难提供帮助。您可以尝试qdap
的？bag_o______________________________________________？我不熟悉weka。@RichardScriven除了上面的代码之外，我还应用了weightTfIdf（）函数。因此，预期结果应该是：-coulmns的数量=术语的数量，行的数量=文档的数量。每个单元格中的值=相应文档中每个术语的频率。




[r]相关文章推荐



                                                        
如何在R中的列中每隔12个元素添加一个元素？
rdataframe 
R 为数据帧提供真值的最简单方法是什么？
rdataframe 
如何通过R中的参数生成chisq.test（）
rstatistics 
R K-表示初始中心成员资格
r 
R 如果从其他函数中调用，访问屏蔽函数的理想方式是什么？
r 
如何为httr:：GET config参数提供多个配置值
r 
替换r中特定百分比的向量
r 
R-分组条形图百分比
r 
将列联表从R导出到excel的最有效方法
rexcel 
通过使用R传递多个搜索请求来刮表
rweb-scraping 
如何在数据集中的R中循环列，为每列和分组因子创建交叉表，然后应用fisher'；什么是精确测试？
rfunctionloopsstatistics 
R 尝试在数据帧向量上循环
rloops 
r不允许在我的while（）循环中进行100次迭代
rstring 
R 更改ggplot中的布局
r 
R 将多时间序列图的数据帧与数据帧隔离
rdataframe 
自动功能评估-R
r 
R 累计不同数字和重置
r 
R 如何连接数据
r 
对齐shinydashboard盒内的小部件？
rshiny 
R 熔化二进制列中的数据
r 
                                       





随机文章推荐



                                                        
Azure functions Azure函数执行能否确定自己的传出/外部IP地址？
azure-functions 
Azure functions local.settings.json不属于"；出版「；文件夹和部署不成功
azure-functions 
Azure functions Azure函数2-缺少using指令或程序集引用？
azure-functions 
Azure functions 使用Azure函数处理来自IoT Hub的传入JSON消息
azure-functionsazure-cosmosdb 
Azure functions 如何使用Postman调用Azure AD B2C保护功能？
azure-functionspostmanazure-ad-b2c 
Azure functions 如何将从blob触发器接收的请求排队？
azure-functions 
Azure functions CosmosDBTrigger是否能够准确地处理每个文档一次？
azure-functionsazure-cosmosdb 
Azure functions Azure函数的CosmosDB触发器
azure-functionsazure-cosmosdb 
Azure functions 使用Ms graph设置更改通知（订阅）服务后，如何在visual studio中从Azure function app获取通知
azure-functionsmicrosoft-graph-api


                                        

                                        
                                        


                                                
                                                        [string]相关推荐
                                                        
String utf-8格式八位字节字符串示例
									String
							 									Utf 8
							 
String MASM StrCmp未定义？
									String
							 
String java十进制分隔符
									String
							 									Jvm
							 
String 使用批处理文件提取字符串的可变部分以用于重命名txt文件
									String
							 									Variables
							 									Batch File
							 
String qHash在计算机上是一致的吗？
									String
							 									Qt
							 									Database Design
							 									Hash
							 
String 在vb6中，如何从C dll检索char*参数？
									String
							 									Dll
							 									Vb6
							 
String 在不使用外部库的情况下将文件中的行标记化的好方法？
									String
							 
String 将字符串变量转换为整数的最有效VBA代码
									String
							 									Excel
							 									Vba
							 									Optimization
							 
String Matlab中的多行字符串文字？
									String
							 									Matlab
							 
String 如何在不丢失空格的情况下拆分变量中的字符串？
									String
							 									Parsing
							 									Batch File
							 
String 对照其他列表检查电子邮件地址列表
									String
							 									Bash
							 
String 仅使用模式匹配提取文件名
									String
							 									Lua
							 
String 从MATLAB文件中提取字符
									String
							 									Matlab
							 
String 从Haskell中的IO字符串获取值
									String
							 									Haskell
							 									Functional Programming
							 
String 将带引号的字符串参数传递给bash脚本
									String
							 									Bash
							 
String 在matlab中读取缺少e分隔符的科学数字
									String
							 									Matlab
							 
String 找出是否存在两个相邻的相同子字符串
									String
							 									Algorithm
							 									Hash
							 
String dropLast方法抛出致命错误，无法减少startIndex
									String
							 									Swift
							 
String 基于多个规则和值拆分字符串
									String
							 									Excel
							 									If Statement
							 									Excel Formula
							 
String 到NSDate的特定字符串格式
									String
							 									Swift
							 
Swift：如何将String转换为[String]？
									String
							 									Swift
							 
String 如何在Matlab中将字符串变量转换为布尔值？
									String
							 									Matlab
							 
String 在字符串中反转单词中的字母
									String
							 									Java 8
							 
String 从完整路径字符串中提取文件名
									String
							 									Bash
							 
String 嵌套行到数组转换和访问特定值
									String
							 									Bash
							 									Awk
							 
String 使用redigo读取Redis键值，该键值是JSON字符串
									String
							 									Go
							 									Redis
							 
如何在Scala中将字符串（类型为Map[String，String]）转换为常规映射
									String
							 									Scala
							 
String 如何在Amazon Quicksight中还原字符串
									String
							 									Amazon Web Services
							 
匹配str或String的片段
									String
							 									Rust
							 
String 如何从Dart/FLIFT中的字符串（例如电话号码）中提取数字？
									String
							 									Flutter
							 									Dart
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Ruby
Robotframework
Django Models
Doctrine Orm
Ios
Unix
Amazon S3
Loops
Synchronization
Reporting Services
Editor
Silverlight 4.0
Asynchronous
Razor
Mediawiki
Gulp
Url
Twitter
Tinymce
Youtube Api
Batch File
Pip
Streaming
Generics
Processing
Postman
Bison
Drupal 6
Network Programming
Macos
Hibernate
Graphviz
Amazon Web Services
Ssis
Tabs
Wix
Subsonic
Math
Ubuntu
Airflow
Optimization
Pytorch
Cocos2d X
Snowflake Cloud Data Platform
Sqlite
Activemq
Django Rest Framework
Google Cloud Platform
Windows Phone 7
Time Complexity
Assembly
Cloud Foundry
Three.js
Awk
Node.js
Vector
Odata
Ssh
Entity Framework
Jsf
Vue.js
Akka
Hybris
Cryptography
Facebook Graph Api
Shiny
Primefaces
Ionic2
Tkinter
Smalltalk
Swift2
Plsql
Puppet
Ruby On Rails
Deployment
Ruby On Rails 4
Dynamics Crm 2011
Polymer
Spring Security
Android Emulator
Stm32
Json
Tcl
Ruby On Rails 3
Algorithm
Struts2
Localization
Joomla
Outlook
Windows
Mule
Parameters
Autocomplete
Sencha Touch
Hadoop
Telerik
Ibm Mobilefirst
Coq
Proxy
Listview
Dns
Webgl
Omnet++
Apache Zookeeper
Eclipse Rcp
Firefox Addon
Azure Ad B2c
C++
Language Agnostic
Xpath
Typo3
Tfs
Debian
Open Source
Cmake
Dotnetnuke
Recursion
Uitableview
Opengl Es
Xcode4
Cocos2d Iphone
Netlogo
Installation
Cookies
Terraform
Pyspark
Scrapy
Openlayers
Asp Classic
Ip
Search
Prestashop
Hazelcast
Github
Google Sheets
Rspec
Ecmascript 6
Merge
Pagination
Push Notification
Ansible
Electron
Laravel 5
Log4j
Google Apps Script
Apache Camel
Sass
Ide
Jersey
Angular
Smtp
Qt4
Tree
Kibana
Flash
Forms
Symfony1
C# 4.0
Plugins
Virtualbox
Windows Phone 8.1
Log4net
Certificate
Asp.net Mvc
Keycloak
Windows Runtime
List
Kotlin
Internationalization
Geolocation
Influxdb
Ocaml
Windows 7
Variables
Google Maps Api 3
Discord.py
Dependency Injection
Jwt
Graphics
Couchdb
Php
Csv
Filter
Tcp
Speech Recognition
Fortran
Jsp
Ruby On Rails 3.2
Bots
Teradata
Curl
Apache Pig
Single Sign On
Tsql
Drools
Shell
Apache Kafka
Google Calendar Api
Reference
Powerbi
Performance


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网