R 如何使用tm软件包进行希伯来语或阿拉伯语文本分析_R_Text_Tm - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/66.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
R 如何使用tm软件包进行希伯来语或阿拉伯语文本分析_R_Text_Tm - Fatal编程技术网

R 如何使用tm软件包进行希伯来语或阿拉伯语文本分析

r text

R 如何使用tm软件包进行希伯来语或阿拉伯语文本分析,r,text,tm,R,Text,Tm,我想使用tm软件包进行希伯来语或阿拉伯语文本分析。我尝试了几种方法，看看tm是否能够处理一些单词，但我遇到了一个错误，有没有办法解决这个问题 text <- "הנוסעים חיכו זמן רב לנסיעה" Encoding(text) #[1] "unknown" Encoding(text) <- "UTF-8" ap.corpus <- Corpus(DataframeSource(data.frame(text))) ap.corpus <-

我想使用tm软件包进行希伯来语或阿拉伯语文本分析。我尝试了几种方法，看看tm是否能够处理一些单词，但我遇到了一个错误，有没有办法解决这个问题

 text  <- "הנוסעים חיכו זמן רב לנסיעה"
 Encoding(text)
#[1] "unknown"
 Encoding(text)  <- "UTF-8"
 ap.corpus <- Corpus(DataframeSource(data.frame(text)))
 ap.corpus <- tm_map(ap.corpus, removePunctuation)
 ap.corpus <- tm_map(ap.corpus, content_transformer(tolower))
Error in FUN(content(x), ...) : 
  invalid input 'הנוסעים חיכו זמן רב לנסיעה' in 'utf8towcs'

text来自：
语料库构造函数的第二个参数readerControl必须是
包含命名组件读取器和语言的列表。（……）最后
第二个组件语言设置文本的语言（最好使用
ISO 639-2标准）
从中，阿拉伯语的ISO 639-2代码为ara，希伯来语的ISO 639-2代码为heb。所以不妨试试这个：
 ap.corpus <- Corpus(DataframeSource(data.frame(text), readerControl = list(language = "heb")))

ap.corpus答案如下，我们需要添加这种编码方法：
iconv(text, "ISO-8859-8", "UTF-8")[1]

我没有使用：Encoding（text）Hi@Hoju，而是得到了：DataframeSource（data.frame（text），readerControl=list（language=“heb”）：未使用的参数（readerControl=list（language=“heb”））




[text]相关文章推荐



                                                        
Text 删除包含重复单元格的行
text 
Text 基于80端口的文本代理
textproxy 
Text 确定文本正文中是否包含有效的单词或仅包含“"；胡言乱语“；
textstatistics 
Text 我需要帮助查找此代码中的文本并修复它？
text 
Text 谷歌应用程序脚本从网页抓取数据
textgoogle-apps-script 
Text 如何在要使用Applescript编辑的文件中设置索引？
textindexingapplescript 
Text F#脚本逐行读取文件并在每行中添加字符串
textf# 
Text 批量显示集合下的文本或行
textinputbatch-file 
Text 基于文本的冒险帮助和提示
textbatch-file 
Text 自动保存基于批处理的文本冒险游戏？
textbatch-file 
Text 法语文本的xslt转换
text 
Text 相似文本挖掘算法
text 
Text 如何在createJS中删除绘制的文本
text 
Text 不能查看随机文本
textrandomlua 
Text 如何使用applescript从Google drive上的共享文件中获取文本
textapplescript 
Text 文本编辑器如何存储超过1字节的数据？
textunicode 
如何将textrect.center中的文本向左对齐？
text 
Text 如何在Crystal Report中基于标题值抑制文本对象？
textcrystal-reports 
Text 将TXT文件中的所有点替换为数字中的逗号
text 
Text 尝试识别类似于ruby注释的文本标记
text 
                                       





随机文章推荐



                                                        
带着某种钥匙圈的Cygwin
cygwin 
如何设置cygwin根目录？
cygwin 
Cygwin /usr/local/bin:/usr/bin:指向$PATH的末尾，而不是顶部
cygwin 
Cygwin JRuby+；RVM&x2B；西格温
cygwin 
无法在Cygwin中生成可移植Fortran可执行文件
cygwinfortran 
Cygwin 试图运行Docker导致退出代码127
cygwindocker 
Cygwin：为什么我们需要；出口贝壳；设置-o igncr“；
cygwin 
Cygwin的“source”命令在安装包时失败
cygwin 
Cygwin FIFO与本机Linux FIFO-阻塞行为的差异？
cygwin


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Plsql
Delphi
Mysql
Ag Grid
Model View Controller
Openssl
Nosql
Karate
Silverstripe
Laravel 5
D3.js
Concurrency
Jwt
Quickbooks
Amazon Dynamodb
Exception Handling
Utf 8
Ionic Framework
Svg
Cygwin
Sharepoint 2010
System Verilog
Sqlalchemy
Amazon Cloudformation
Fonts
Glassfish
Xcode
Windows Services
Opencart
Powerbi
Continuous Integration
Clang
Seo
Air
Anaconda
Android Fragments
Vue.js
Ocaml
Dynamics Crm
Frameworks
Matrix
Graphql
Activemq
Linker
Asp.net Mvc 3
Awk
.htaccess
Ember.js
Makefile
Docker Compose
Replace
Jvm
Webgl
Sed
Vuejs2
Notifications
Kernel
Spring Integration
Bazel
Reference
Devexpress
Cocoa Touch
Arm
Browser
Post
Spring Boot
Oauth 2.0
Aem
Reactjs
Google Cloud Firestore
Office Js
Jekyll
Codeigniter
Symfony1
Yii2
Visual Studio 2012
Gatsby
Cloud
Sharepoint
Codenameone
Google Api
Visual Studio 2008
Junit
Windows
Knockout.js
Functional Programming
Proxy
Amazon Redshift
Websocket
Angularjs
Data Structures
Geolocation
Xamarin.android
Asterisk
Autodesk Forge
Twitter Bootstrap
Soap
Javafx 2
Scikit Learn
Redux
Https
Playframework
Ada
Routing
Influxdb
Gstreamer
Subsonic
Github
Chef Infra
Google Drive Api
Editor
Camera
Electron
Bluetooth
Nestjs
Time
Db2
Android Layout
Monitoring
Eclipse Plugin
Service
Collections
Xamarin.ios
Unit Testing
Opengl
Gps
Git
Sip
Authentication
Lotus Notes
Pandas
Url Rewriting
Jsf 2
Extjs
Log4net
Jasper Reports
Jenkins
Apache Spark
Jsf
Drools
Vmware
Sorting
Big O
Dns
R
Google Plus
Passwords
Internet Explorer 8
Report
Asp.net Mvc 5
Oracle
Twitter Bootstrap 3
Forms
Cmake
Alfresco
Macos
Asp Classic
Hybris
Haskell
Octave
Search
Wso2
Gtk
Fortran
Nativescript
.net
Plot
Youtube Api
Nlp
Bots
Tfs
Error Handling
Sql Server 2008
Libgdx
Heroku
Facebook
Amazon Web Services
Web Crawler
Cron
Razor
Cmd
Marklogic
Dll
Openshift
Text
Parameters
Weblogic
Jqgrid
Exception
Lambda
Udp
Perforce
Calendar
Jquery
Prometheus
Typo3
Jsp
Autocomplete
Ibm Cloud
Regex
Sql Server 2008 R2


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网