Python 空间：不正确的令牌。向量计算_Python_Nlp_Spacy - Fatal编程技术网

Python 空间：不正确的令牌。向量计算

python nlp

Python 空间：不正确的令牌。向量计算,python,nlp,spacy,Python,Nlp,Spacy,守则： doc = nlp(u"Apples and oranges are similar. Boots and hippos aren't.") print doc[0],doc[2],doc[6],doc[8] apples = doc[0] oranges = doc[2] boots = doc[6] hippos = doc[8] print(apples.similarity(oranges)) print(boots.similarity(hippos)) 结果: Apples

守则：

doc = nlp(u"Apples and oranges are similar. Boots and hippos aren't.")
print doc[0],doc[2],doc[6],doc[8]
apples = doc[0]
oranges = doc[2]
boots = doc[6]
hippos = doc[8]
print(apples.similarity(oranges))
print(boots.similarity(hippos))

结果:

Apples oranges Boots hippos
0.0
0.0

表示相似度越高，返回的值越高，但苹果和橙子的相似度为0。为什么?

编辑下面的代码解释了相似度计算不正确的原因这是由于矢量计算不正确造成的：

doc = nlp(u'apples is apple. orange is not. oranges is nothing')
def dot_prd(a, b):
    ans = 0
    sa, sb = 0, 0
    for i in range(len(a)):
        ans += a[i]*b[i]
        sa += a[i]*a[i]
        sb += b[i]*b[i]
    sa = sa**0.5
    sb = sb**0.5
    return ans/(sa*sb)

print doc[0], doc[2], doc[4], doc[8]

print dot_prd(doc[0].vector, doc[2].vector), dot_prd(doc[0].vector,      doc[4].vector), dot_prd(doc[0].vector,doc[8].vector), dot_prd(doc[4].vector,    doc[8].vector)

print doc[0].similarity(doc[2]), doc[0].similarity(doc[4]),    doc[0].similarity(doc[8]), doc[4].similarity(doc[8])

输出：

apples apple orange oranges
0.750411317806 0.51238496547 nan nan   #Resuults of cosine-simlarity
0.750411349583 0.512384940626 0.0 0.0  #token.simlarity()

doc[8]。向量全为零。那么，为什么“oranges”标记的向量计算为all-0？
“橙色”和“苹果”的矢量计算正确。更重要的是，“苹果”的矢量也计算正确。那么，为什么“橙子”是个问题呢
 因为2标记（“橙子”和“河马”）的词向量为零（这是模型问题）
您可以通过打印此令牌的向量进行检查：
打印（橙色。矢量）
打印（河马。矢量）
是的，我想。我在GitHub问题上添加了编辑，但忘了在这里更新它。不管怎样，谢谢。现在一切都好了。




[nlp]相关文章推荐



                                                        
Nlp Wordnet数据库中的字母位于奇怪/无效的位置
nlp 
Nlp 英语给巴别塔·朗
nlpartificial-intelligence 
Nlp 如何计算两个文本文档之间的相似度？
nlp 
Nlp 集中命名实体识别（NER）？
nlpmachine-learning 
如何使用nlp java提取主谓宾
nlp 
Nlp 如何在NLTK中从文本中提取关系
nlp 
Nlp 关于从TripAdvisor抓取数据有什么建议吗
nlpweb-crawler 
在NLP应用程序中存储语言模型最有效的方法是什么？
nlp 
Nlp 强化学习中无限状态空间模型的构建
nlpartificial-intelligence 
Nlp 主题建模
nlp 
Nlp 聊天机器人-可以调用Watson API来响应用户查询吗？
nlp 
NLP挑战：自动删除参考书目/参考文献？
nlp 
Nlp 变音3和双变音的区别
nlp 
Nlp 当计算两个单词的共现时，我们是把句子分开还是把所有的句子连起来？
nlp 
Nlp 如何改进空间模型以完全识别坐标？
nlp 
SPACYNLP：适用于可以是动词的专有名词-根据输入顺序的歧义性和基于标点符号的拆分
nlp 
Nlp 如何使用spacy或nltk检索句子的主要意图？
nlp 
Nlp Spacy文本分类：超越基础提高性能
nlp 
Nlp 词频数据库
nlp 
Nlp 在相同设置下培训BET时的可恢复损失/结果>=两次
nlppytorch 
                                       





随机文章推荐



                                                        
Colors 颜色理论：如何将蒙塞尔HVC转换为RGB/HSB/HSL
colors 
Colors 确定颜色饱和度的问题
colors 
Colors 如何在ImageMagick中更改亮度色调和部分去饱和图像？
colorsimagemagick 
Colors Gnuplot：根据数据范围为背景着色
colorsgnuplot 
Colors 在多窗格Highstock图表中仅为一个窗格设置背景色
colorshighcharts 
Colors gnuplot等高线颜色：设置样式线和设置线型无效
colorsgnuplot 
Colors CIELAB颜色空间中的坐标范围是什么？
colors 
Colors 颜色-R、G、B值。使一种颜色出现；“打火机”；对人的眼睛来说。有人能给我解释一下吗？
colors 
Colors GLSL颜色与纹理ontop
colorsglsl 
Colors 使用swift将pull更改为刷新文本颜色
colorsswift 
Colors pdfbox表格标题着色工作不正常
colors 
Colors 与单个像素一起使用时的网格材质颜色修剪器'；s在Three.js中获取ImageData
colorsthree.jshtml5-canvas 
Colors ImageMagick-查找图像中三角形的平均颜色
colorsimagemagick 
Colors Jubula RCP应用程序-选中行时检查TableViewer单元格的背景色
colors 
Colors xfce4/gtk-3.0-更改面板DateTime小部件的文本颜色？
colorsconfiguration 
Colors 如何解读android电报主题中的颜色模式-.attheme
colorstelegram 
Colors 暗色调抖动
colors 
Colors 如何改变ModernCV乳胶棒的颜色
colorscomputer-visionlatex 
Colors Tailwind CSS扩展Tailwind.config.js中的标准颜色。当我尝试扩展颜色时，所有其他颜色都会被删除
colors


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python PyQt：加载时的启动屏幕；沉重的；图书馆
									Python
							 									Performance
							 									Matplotlib
							 
在哪里可以找到GIO'的Python绑定；那是什么？
									Python
							 									C
							 									Sockets
							 									Binding
							 
Python 解析wikimediaapi
									Python
							 									Xml
							 									Regex
							 									Mediawiki
							 
Python 在thread.start（）之后运行时，子进程将失效
									Python
							 
python中的跨平台高精度时间
									Python
							 									Time
							 
Python 如何在微调器中允许无限整数值？
									Python
							 
Python在文件的同一行中写入
									Python
							 									File
							 									Loops
							 
通过Python SMTP服务器发送邮件
									Python
							 									Smtp
							 
Python 用二元规划求解背包问题
									Python
							 									Algorithm
							 
Python 绘图材料结构-Pymatgen
									Python
							 									Plot
							 
如何使用Python Wand/ImageMagick将PSD转换为PNG？
									Python
							 									Imagemagick
							 
Python 极限数组上的scipy.integrate.quad
									Python
							 									Arrays
							 									Numpy
							 
Python 将数据帧中每列的值设置为第90百分位
									Python
							 									Pandas
							 									Dataframe
							 
Python 为什么我必须添加一个空白的_init__u;.py文件来从子目录导入
									Python
							 
Python 在Django Rest中捕获URL参数
									Python
							 									Django Rest Framework
							 
Python 无法将字符串转换为浮点读取列
									Python
							 									Pandas
							 									Matplotlib
							 
Python While循环问题。如何让我的while循环检测一个人是否说yes、y、n或no？
									Python
							 									Loops
							 									Input
							 
Python Pygame按字节加载声音会缩短声音的长度
									Python
							 									Audio
							 
Python webdriver处于headless选项时图像屏幕出现问题
									Python
							 									Image
							 									Selenium
							 									Selenium Webdriver
							 
Python 如何将时间序列3d numpy数组转换为2d panda数据帧，以便将其导出为csv
									Python
							 									Pandas
							 									Numpy
							 
Python 是否可以访问变量方法以结束线程循环？
									Python
							 									Tkinter
							 
Python ove（事件x、事件y）
def set_moving_false（事件=无）：
对于obj_lst中的obj：
如果对象允许移动：
obj.allow_move=False
def create_obj（事件=无）：
对象附加（圆（画布、事件x、事件y））
def保存（事件=无）：
打开（'untitled.canvas'，'w'）作为文件：
obj_dict={f'{obj.type}{id}'：（obj.x，obj.y）表示id，枚举中的obj（obj_lst）}
dump（obj_dict，文件）
									Python
							 									Tkinter
							 									Canvas
							 
在本地（非Azure）docker实例中使用Azure提要中的python包
									Python
							 									Azure
							 									Docker
							 
Python 如何使用数据框架从Sharepoint上载和检索数据？
									Python
							 									Excel
							 									Pandas
							 									Sharepoint
							 
Python 用于训练多输入功能keras模型的多个x输入格式
									Python
							 									Numpy
							 									Tensorflow
							 									Keras
							 
Python 插入MySQL表或更新（如果存在）
									Python
							 									Sql
							 
当PHP脚本返回成功时触发Python异步函数
									Python
							 									Php
							 									Linux
							 
Python 正在尝试将数据加载到SQL server数据库中已创建的表中。我能够连接并创建新表，但无法加载df
									Python
							 									Sql Server
							 									Pandas
							 
Python 特金特'；函数的作用是截断标签的第一个字母
									Python
							 									User Interface
							 									Tkinter
							 
从python_语音_功能中使用mfcc并获取内存错误
									Python
							 									Machine Learning
							 									Memory
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Jmeter
Continuous Integration
Windows 7
Maven
Quickbooks
Git
Mfc
Arrays
Mediawiki
Process
Swift
Bots
.net 4.0
Magento2
Raspberry Pi
Robotframework
Hibernate
Lucene
Svg
Types
Windows Phone 8
Linkedin
Sdk
Visual Studio 2012
Netbeans
Validation
Android Fragments
Mqtt
Sockets
Installation
Clearcase
Protocol Buffers
Lua
File Io
Openlayers
Gis
Wcf
Mdx
Phpmyadmin
Orm
Asp.net Core Mvc
C# 4.0
Mvvm
Java 8
Material Ui
Google Plus
Actionscript
Codenameone
Sip
Next.js
Umbraco
Extjs
Configuration
Network Programming
Osgi
Migration
Google Cloud Dataflow
Dependencies
Notifications
For Loop
Orchardcms
Racket
Webview
Bootstrap 4
Vba
Corda
Ip
Airflow
Xcode
Jpa
Multithreading
Zurb Foundation
Ide
Ajax
Prometheus
Visual C++
Odoo
Binary
Dart
Blackberry
Windows 10
Hybris
Python 3.x
Eclipse Plugin
Visual Studio 2013
Pycharm
Ckeditor
Netty
Rest
D3.js
Directory
Ios8
Nativescript
Polymer
Performance
Coldfusion
Responsive Design
Layout
Microsoft Graph Api
Ipython
Libgdx
Dll
Dataframe
Apache Pig
Dojo
Entity Framework Core
Webrtc
Nlp
Google Maps
Cocos2d X
Openlayers 3
Silverlight
Reporting Services
Xslt
Ios
Nservicebus
Gdb
Algorithm
Drupal
Browser
Llvm
Authentication
Wxpython
Design Patterns
Actions On Google
Keyboard
Powerbi
Nsis
Apache Spark
Css
Artifactory
Url
Latex
Sql
Gnuplot
Silverstripe
Hazelcast
Ocaml
Workflow
Teradata
Login
Unity3d
Oracle Apex
Xamarin.ios
Date
Extjs4
Jetty
Matrix
Jqgrid
Serialization
Here Api
Pyspark
Asp.net Mvc 4
Cordova
Google App Maker
File
Debian
Serial Port
Mapbox
Ms Word
Jsf
Service
Azure Ad B2c
Listview
X86
Cobol
Passwords
Geolocation
Jquery
Coding Style
Anaconda
Kentico
Monitoring
Parallel Processing
Join
Vector
Pascal
Three.js
Testng
Numpy
Cookies
Navigation
Database Design
Nuget
Ada
Mpi
Jquery Mobile
Binding
Gruntjs
Sml
Chart.js
Time Complexity
Kubernetes
Cmd
List
Macros
Android Emulator
Bazel
Memory Management
Angular6
Jsp


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网