用R识别/区分两个句子_R_Text_Matrix_Similarity - Fatal编程技术网

用R识别/区分两个句子

r text matrix

用R识别/区分两个句子,r,text,matrix,similarity,R,Text,Matrix,Similarity,下面是我的数据示例身份证地址 Table1:User table id address 1 mont carlo road,CA 2 mont road,IS 3 mont carlo road1-11,CA Table 2(The output I wanna get) Similarity Matrix id 1 2 3 1 2 3 3 1 3 1～3 very similar～very dissim

下面是我的数据示例

身份证地址

Table1:User table
id     address
1      mont carlo road,CA
2      mont road,IS
3      mont carlo road1-11,CA

Table 2(The output I wanna get)
Similarity Matrix
id   1    2    3

1  

2    3  

3    1    3

1～3 very similar～very dissimilar

我的问题是如何通过表1中的地址识别案例之间的相似性，然后输出一个结果，如R中的表2所示的相似矩阵。重点是如何计算R中两个句子之间的比较，然后设置一个尺度来衡量一对句子之间的相似性，最后输出一个矩阵。

您可能对R包中实现的矩阵感兴趣。例如：

library(stringdist)
address <- c("mont carlo road,CA", "mont road,IS", "mont carlo road1-11,CA")
stringdist(address[1], address[2], method="lv")
[1] 8

库（stringdist）
地址我也会使用stringdist
包，但会使用outer
和cut
来完成工作：
library(stringdist)
dat <- data.frame(
    address = c("mont carlo road,CA", "mont road,IS", "mont carlo road1-11,CA"),
    id = 1:3
)

m <- outer(dat[["address"]], dat[["address"]], stringdist, method="jw")

m[lower.tri(m)] <- cut(m[lower.tri(m)], 3, labels=1:3)
m[upper.tri(m)] <- cut(m[upper.tri(m)], 3, labels=1:3)
dimnames(m) <- list(dat[["id"]], dat[["id"]])
diag(m) <- NA
m

##    1  2  3
## 1 NA  3  1
## 2  3 NA  3
## 3  1  3 NA

库（stringdist）
谢谢你的建议。我正在寻找R中的详细方法/算法。请参阅我的答案与此问题的链接：




[text]相关文章推荐



                                                        
Text 使用编辑器名的谷歌博客站点
text 
Text Crystal Reports：围绕图像/页边距缩进对齐的文本字段流
textlayoutcrystal-reports 
Text 如何将某个程序的输出列化？
text 
Text sas生成所有可能的拼写错误
textsas 
Text Phpmyadmin显示与blob和文本字段相同的字段
textphpmyadmin 
Text 从博客条目中分类性别的文本分类
text 
Text 使用windows批处理合并两个unicode文本文件的非空行
textbatch-filereplace 
Text 用VBscript替换CSV文件中的数字，而不替换所有文本
textvbscriptreplace 
Text 使用VBS脚本在文本文件中查找特定字符串
textvbscript 
Text 当我打开使用记事本创建的文件时，为什么Windows记事本将所有代码行放在一行上+；？
texteditornotepad++ 
Text 升华文本字体目录
textfontsdirectory 
Text Python Tkinter可点击文本？
textcolorstkinter 
Text 匹配给定文本文件中的大量条目列表
text 
Text 神经网络分析中文本关键词的量化
textmachine-learningneural-network 
Text 连接文本文件的两列
textawk 
Text 如何将带圆圈的数字转换为数字？（&x2460；至1）
textencoding 
Text 将隐藏数据添加到文本文件
text 
Text 在数千个文本片段中查找最常见的一系列单词
text 
Text 任何简单的文本文件合并（带LF的固定文本）
textmerge 
Text 为什么文本在云控制台上打印不到位，而不是通过SSH打印？
textssh 
                                       





随机文章推荐



                                                        
控制器中的Laravel 4视图名称
laravellaravel-4 
Laravel-安装旧版本的软件包
laravel 
Laravel 如何按输入顺序返回最后n条记录
laravel 
使用Laravel'获取新的结果集；s查询生成器
laravellaravel-4 
检查laravel'中是否存在线路；s trans（）
laravellaravel-4 
Laravel 拉维长生不老药用于缩小尺寸的用途是什么？
laravel 
Laravel 有没有办法对分形集合进行排序？
laravel 
使用Laravel中的现有PDO链路
laravelorm 
如何在laravel 5.3中显示图像
laravel 
Laravel 拉威尔的布景独白中的问题
laravellogging 
Laravel 分页时结果页未保留查询
laravel 
Laravel updateOrCreate不返回'；id'；柱
laravel 
Laravel加密数据检查
laravelencryption 
Laravel 声明性呈现问题
laravelvue.js 
Laravel雄辩的结果在使用dd时不提供查看属性的选项
laraveljoinlaravel-5 
laravel中单选按钮的问题
laravel 
向laravel中的请求数组添加浮点值
laravel 
Laravel 这些'；刀片功能&x27；startSection（）和stopSection（）？
laravel 
如何在laravel中通过单个控制器中的多个路由
laraveltwitter-bootstrap 
如何检索经过身份验证的用户（不使用默认用户表）-Laravel 7
laravelauthentication


                                        

                                        
                                        


                                                
                                                        [r]相关推荐
                                                        
R色树状图建议？
									R
							 
将计数的数据帧转换为R中的比例
									R
							 
如何从Rcpp定义R函数？
									R
							 
R 如何将数据帧指定为时间序列？
									R
							 
在R中对多列数据进行排序
									R
							 
as.character，用于将一列中的值替换为另一列中的值
									R
							 									Replace
							 
R-ddply函数
									R
							 
Rmarkdown到Word输出-在标题上方插入图像
									R
							 
R 从CSV解析货币值，转换百万和十亿的数字后缀
									R
							 
R更改列表中每个数据集的变量名
									R
							 									List
							 
R 选项板，具有用户定义长度的颜色编码
									R
							 
R 使用ggplot2填充特定直线下方和之间的区域
									R
							 
R 如何解决此错误：尝试设置'；行名'；在没有维度的对象上
									R
							 
如何使用dplyr加速行级操作
									R
							 
&引用；第二个参数必须是列表；在Rhandsontable中的Hot_to_r函数中
									R
							 									Shiny
							 
如何用R中按因子分类的数据帧的值创建向量？
									R
							 
删除R中的假负值
									R
							 
如何将多个forecast:：Accurance（）结果的输出合并到表中进行比较和打印
									R
							 
pgirness中的相关函数问题
									R
							 
R 将csv写入s3，使其具有直接位于存储桶内的凭据
									R
							 									Amazon Web Services
							 									Amazon S3
							 
R 有没有办法根据匹配的列值比较两个不同长度的数据帧？
									R
							 									Dataframe
							 
R 如何在windows上差异安装软件包？
									R
							 
减去R中向量列表中类似命名的元素
									R
							 									List
							 									Function
							 
R ggplot如何识别变量是连续的还是离散的？
									R
							 									Function
							 									Dataframe
							 
R 错误：y中的观察数不等于x的行数
									R
							 
R 如何将多个图形添加到我的闪亮应用程序？
									R
							 									Shiny
							 
R 使用ggplot生成条形图，但不显示条形图
									R
							 
R/dplyr：如何在数据帧中只保留整数？
									R
							 									String
							 
使用dplyr基于多个条件连接数据帧
									R
							 									Join
							 
在R中如何将lappy与get.mu matrix（）一起使用？
									R
							 									List
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Talend
Odata
Parallel Processing
Excel Formula
Redux
Hive
Dependency Injection
Resharper
Cygwin
Permissions
Windows Mobile
Swift2
Merge
Verilog
Apache Pig
Ftp
Cassandra
Encoding
Jdbc
Mpi
Jwt
Windows
Sql
Ant
Swagger
Asp.net
Sql Server 2008 R2
Performance
Login
Markdown
Makefile
Azure Ad B2c
Silverlight 4.0
Azure Cosmosdb
EmptyTag
Dynamics Crm 2011
Web
Joomla
Apache Nifi
Grails
Clojure
Lua
Core Data
Servlets
Compiler Construction
Influxdb
Google Chrome Devtools
Vba
Ethereum
Operating System
Class
Osgi
Polymer
Puppet
Nhibernate
Extjs4
Telegram
Ffmpeg
Node.js
Angular
Asterisk
Maps
Interface
Tfs
Phpunit
Fonts
React Native
Scrapy
Forms
Nestjs
Sass
Ios6
Apache
Terminal
Tcp
Sonarqube
Session
Discord.py
Vb6
Google Cloud Storage
R
Junit
Fiware
Kibana
Lotus Notes
Mule
X86
Glassfish
Gatsby
Yocto
Jestjs
Plot
Geometry
Random
Visual Studio 2012
Csv
Web Services
Windows 8
Android
Methods
Pip
Google Maps
Ssh
Symfony1
Arm
Aframe
Composer Php
Wolfram Mathematica
Jetty
Streaming
Entity Framework Core
Xml
Module
Sphinx
Octave
Testng
Ruby On Rails
Ajax
Windows Services
Angular Material
Object
Xamarin.android
Oauth
Php
Solr
Anaconda
Batch File
Automated Tests
Xcode4
Ocaml
Google App Maker
Coding Style
Entity Framework
Windows Phone 8
Memory
Xamarin.ios
Nlp
Sip
Jquery
Video Streaming
Neural Network
Passwords
Qt4
Validation
Google Analytics
Nunit
Opencv
Jira
Ckeditor
Redirect
Nest
Drupal 6
Sugarcrm
Utf 8
Perl
Google Cloud Dataflow
Clearcase
Isabelle
C++ Cli
Canvas
Linker
Vmware
Sencha Touch 2
Zsh
Graphics
Ssl
Jsp
Logging
Nativescript
Matlab
Templates
Asynchronous
Collections
Visual Studio 2017
Rest
Apache Kafka
Directory
Content Management System
Graphviz
Service
Url
Mapbox
D
Mapreduce
Virtual Machine
Visual Studio Code
Kdb
Google Maps Api 3
Dojo
Entity Framework 4
Wxpython
Hyperledger Fabric
Postgresql
Objective C
Math
Version Control
Yaml
Vagrant
Winforms
Python Sphinx
Ios7


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网