如何在quanteda dfm中维护ngrams？_R_N Gram_Quanteda - Fatal编程技术网

如何在quanteda dfm中维护ngrams？

r

如何在quanteda dfm中维护ngrams？,r,n-gram,quanteda,R,N Gram,Quanteda,我使用quanteda从tokens对象创建文档特征矩阵（dfm）。My tokens对象包含许多ngram（例如：“美国”）。当我使用dfm（）函数创建dfm时，我的ngram被UnderTCore分割（“美国”被分割为“美国”）。如何在维护ngrams的同时创建dfm 以下是我的流程： my_tokens <- tokens(my_corpus, remove_symbols=TRUE, remove_punct = TRUE, remove_numbers = TRUE) my_to

我使用quanteda从tokens对象创建文档特征矩阵（dfm）。My tokens对象包含许多ngram（例如：“美国”）。当我使用dfm（）函数创建dfm时，我的ngram被UnderTCore分割（“美国”被分割为“美国”）。如何在维护ngrams的同时创建dfm

以下是我的流程：

my_tokens <- tokens(my_corpus, remove_symbols=TRUE, remove_punct = TRUE, remove_numbers = TRUE)
my_tokens <- tokens_compound(pattern=phrase(my_ngrams))
my_dfm <- dfm(my_tokens, stem= FALSE, tolower=TRUE)

my_tokens不清楚您使用的是哪个版本的quanteda，但基本上这应该可以工作，因为默认的标记器（来自tokens（）
）不会拆分包含内部
的单词
演示：
库（“quanteda”）
##软件包版本：2.1.1
#tokens（）不会分隔单词
代币（“美国”）
##由1个文档组成的令牌。
##正文1：
##[1]“美国”

这里有一个“美国”的重复例子：
myu语料库




[tree]相关文章推荐



                                                        
Tree 我可以在没有递归和堆栈的情况下按顺序遍历二叉树吗？
tree 
Tree 安装盾牌-如何在功能树中禁用特定功能？
tree 
Tree 二叉搜索树
tree 
Tree 在Smalltalk中构建和查询示例通用树
treesmalltalk 
Tree WindowTester-访问rcp客户端中的文件系统（树）项
treefilesystems 
Tree d3我可以'；不添加节点
treed3.js 
Tree Dijit树筛选和搜索在ObjectStoreModel上不起作用
treedojo 
Tree 向量上的二叉树
tree 
Tree 树，值仅大于给定n的节点
tree 
Tree 启动：如何以编程方式扩展延迟加载的树
tree 
Tree 树分解中的分隔符概念是什么？
tree 
Tree 球拍中的树褶
treeracket 
                                       





随机文章推荐



                                                        
Highcharts 多重数列海图
highcharts 
Highcharts 未来几天的高库存范围选择器
highcharts 
Highcharts 只有第一类出现。很多元素
highcharts 
Highcharts带文本标签的仪表图表
highcharts 
Highcharts 对于highstocks数据分组，如果数据组中的样本数少于一定数量，是否可以将数据组点设置为null？
highcharts 
找不到HighCharts ShowOut的闪亮服务器
highcharts 
Highcharts 是否有可能在海图中绘制超过35000个点
highcharts 
共享工具提示定位器点.plotY在Highcharts堆叠列中始终为0
highcharts 
隐藏图例上的链接系列悬停在Highcharts中
highcharts 
Highcharts：在副标题中显示导航器范围
highcharts


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R 将此函数应用于数据帧中的每一行的更好方法？
									R
							 
如何在不生成绘图的情况下使用mtmm函数r包psy？
									R
							 
在R中将两行合并为一列
									R
							 									Merge
							 
R-数据帧中列值的条件替换
									R
							 
R 伦敦金属交易所康斯帕酒店
									R
							 
R-从HTML表读取数据
									R
							 									Web Scraping
							 
R Alpha透明度在ggplot2中不起作用？
									R
							 
R 如何选择总和为n的元素？
									R
							 
R 如何最有效地将列子集中的0 VAL设置为NA？
									R
							 
R：使用传单绘制多条解码多段线
									R
							 									Maps
							 									Leaflet
							 
使用列表cols-Purrr中存储的函数和参数
									R
							 
R 在组内，跨多个组查找日期所在的正确间隔
									R
							 									Date
							 
R 预测时间序列数据
									R
							 									Date
							 
R 一组ggplot2缺少线型
									R
							 
R 按组和起始年份统计多个连续事件
									R
							 
R中的混合整数线性规划
									R
							 
在R图形中打印文本块
									R
							 
R 数据帧中选定列的总和和平均值
									R
							 									Dataframe
							 
R 仅当所有值均为0或NA时删除行
									R
							 
在函数-R中使用带有文本字符串的if语句
									R
							 
xts将数据从chr转换为数字
									R
							 
如何使用KNN来预测R中的某些东西？
									R
							 									Algorithm
							 
从R中以交互方式运行多个Windows系统命令
									R
							 									Windows
							 									Session
							 									Command Line
							 
使用sapply函数将结果分组到数据名下，并在R中绘图
									R
							 
R 如何从现有直线的端点开始绘图中的直线？
									R
							 									Plot
							 
R 为现有列中的值向数据框添加列
									R
							 
固定效果logit：在r中调整r方形bife包
									R
							 
R 在整齐的数据格式上应用t.test
									R
							 
在forestplot中，设置字体面，使文本为“；普通的；，不起作用，为什么？
									R
							 
R 计算不同组固定年份的百分比变化
									R
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Redirect
Xaml
Transactions
Protractor
Enums
Azure Ad B2c
Marklogic
Compression
C++11
Resharper
Lucene
Oracle11g
Google Maps Api 3
Time
Blazor
Hive
Ruby On Rails
Spring Batch
Function
Php
Dialogflow Es
Ionic2
Io
Ruby On Rails 3.1
Jupyter Notebook
Reflection
Openid
List
Websphere
Time Complexity
Amazon Redshift
Angular6
Linkedin
Continuous Integration
Plone
Jquery
Mvvm
Vue.js
Linq To Sql
Heroku
Inno Setup
Lotus Notes
File Upload
Log4j
Drop Down Menu
Tableau Api
Ldap
Drupal 6
Sdk
D
Github
Calendar
Mapbox
Visual Studio Code
Xamarin.ios
Selenium Webdriver
Openlayers 3
Html
Composer Php
Keyboard
Search
Angular
Sprite Kit
Seo
Unit Testing
Rally
Ant
Autocomplete
Button
Firefox
Kibana
Ada
Rx Java
Jwt
Oauth
Spring
Microservices
Parse Platform
Phantomjs
Boost
React Native
Arm
Filesystems
Logic
Dataframe
Oracle Apex
Excel Formula
Windows Phone
Exchange Server
Url Rewriting
Git
Date
Ssl
Blackberry
Mono
Character Encoding
Authentication
Apache Nifi
Delphi
Neural Network
Exception Handling
Shiny
Youtube
Z3
Reporting Services
Curl
Mapping
Common Lisp
Selenium
Windows
Cypress
System Verilog
Asterisk
Entity Framework
Model View Controller
Sitecore
Ibm Midrange
Collections
Typo3
Outlook
Stored Procedures
Lua
Speech Recognition
Cassandra
Single Sign On
Scala
Compiler Errors
Grep
Download
Validation
Applescript
Liferay
Drupal
Chef Infra
Networking
Compilation
Tsql
Rest
Vb6
Docker
Notepad++
Ionic Framework
Jestjs
Ip
Ios7
Yocto
Css
Keycloak
Svn
Chart.js
Primefaces
Charts
Interface
Air
Aurelia
Google Apps Script
Struct
Sqlalchemy
Javafx 2
Socket.io
Wso2
String
Matrix
Javascript
Qt
Webview
Indexing
Regex
Stata
Actionscript
Jekyll
Mediawiki
Fortran
Bluetooth
Openerp
Coding Style
Syntax
Django Rest Framework
Gdb
Macos
Ssas
Mpi
Here Api
Layout
C# 3.0
C++ Cli
Asp.net
Intellij Idea
Scrapy
Monitoring
Awk
Embedded
Python 2.7
Log4net
Nativescript
Compiler Construction
Encoding
Sql Server
Mqtt
Hybris
Datetime


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网