Python 返回kmeans聚类中最远的离群值？_Python_Scikit Learn_Cluster Analysis - Fatal编程技术网

Python 返回kmeans聚类中最远的离群值？

python scikit-learn

Python 返回kmeans聚类中最远的离群值？,python,scikit-learn,cluster-analysis,Python,Scikit Learn,Cluster Analysis,在sklearn-kmeans聚类之后，有没有简单的方法返回最远的异常值本质上，我想为一堆集群列出最大的异常值。不幸的是，由于分配的原因，我需要使用sklearn.cluster.KMeans。Sascha基本上在注释中给出了它，但是如果X表示您的数据，并且model是KMeans的实例，您可以按照到它们中心的距离对X的值进行排序 X[np.argsort(np.linalg.norm(X - model.cluster_centers_[model.labels_], axis=1))]

在sklearn-kmeans聚类之后，有没有简单的方法返回最远的异常值

本质上，我想为一堆集群列出最大的异常值。不幸的是，由于分配的原因，我需要使用sklearn.cluster.KMeans。

Sascha基本上在注释中给出了它，但是如果

表示您的数据，并且

model

是

KMeans

的实例，您可以按照到它们中心的距离对

的值进行排序

X[np.argsort(np.linalg.norm(X - model.cluster_centers_[model.labels_], axis=1))]

或者，由于您知道每个点都被指定给其中心使到该点的欧几里德距离最小的簇，因此您可以通过一个步骤进行拟合和排序

X[np.argsort(np.min(KMeans(n_clusters=2).fit_transform(X), axis=1))]

K-means不太适合于“异常值”检测

k-均值倾向于将异常值作为一个单元素聚类。然后，异常值具有最小的可能距离，并且不会被检测到

当数据中存在异常值时，K-means不够稳健。实际上，在使用k-means之前，您可能希望删除异常值

请使用kNN、LOF或LoOP之类的工具。
展示一些自己的尝试和想法。这里甚至没有一行代码！你所需要的就是
X
，
kmeans.cluster\u centers\u
，
kmeans.labels\u
（文档中的属性）和一点numpy（比如
np.argsort
和co.）。是的，我就是这样做的，我的意思是，有没有一个函数可以用来返回距离，而不是事后计算距离？你应该提到并展示它！这里有
kmeans.惯性
（平方！）。阅读文档有什么问题？
惯性
给出了平方距离的总和，这在这里似乎没有什么帮助
KMeans.transform（）
给出了各个距离。

[scikit learn]相关文章推荐

Scikit learn 使用SciKit'；s kMeans到集群1'；他自己的文件 scikit-learn

Scikit learn 如何克服joblib'；s"；类型错误：can'；t pickle instancemethod objects“；关于课堂教学法？ scikit-learn

Scikit learn 拟合模型中梯度增强树权值的获取 scikit-learn

Scikit learn Scikit学习分层交叉验证中的差异 scikit-learn

Scikit learn LabelKFold Sklearn交叉验证-文档中的标签是什么意思？ scikit-learn

Scikit learn scikit learn decision tree export graphviz-决策树中的类名错误 scikit-learn graphviz

Scikit learn 当元回归器是sklearn管道对象时，访问MLxtend StackingRegressionor属性 scikit-learn

Scikit learn 小数据集的t-sne困惑 scikit-learn

Scikit learn 具有2个或更多输出类别的Keras fit分类器必须指定公制标签 scikit-learn keras

Scikit learn ImportError:没有名为'；sklearn.uu check_ubuild.u check_ubuild'； scikit-learn

Scikit learn 基于dask的大数据集聚类 scikit-learn cluster-computing dask

Scikit learn 从RandomForestRecessor（）或RandomForestClassifier（）获取回归和分类问题的特征重要性 scikit-learn

Scikit learn sklearn中的规模和适合度有什么区别？ scikit-learn

Scikit learn Sk学习计数矢量器中高稀疏矩阵的意义 scikit-learn nlp

Scikit learn 在jupyter笔记本中出现“获取错误”；文件名、目录名或卷标语法不正确； scikit-learn

随机文章推荐

Integration 使用遗留应用程序进行单点登录的策略 single-sign-on

paperjs中shape.rectangle和path.rectangle之间的差异

Saml 2.0 如何在asp.net中实现SAML？

Scheduled tasks 如何确保计划任务只运行一次 orchardcms

Autosar 等待点和事件

Scheduled tasks 如何为机器学习安排BigQuery和Dataproc google-bigquery pyspark

Saml 2.0 Spring SAML扩展-以编程方式设置entityBaseURL

Spotfire：数据表的某些部分；sp_XXXX"；无法加载。数据源可能丢失或已更改

如何修复python笔记本的conda规范不可满足错误？

Angular5 @输出不在角度模式下工作

Anylogic 动态调整源中的到达率

Anylogic 源块中的速率是否为固定速率？

如何指定'；命名图&x27；使用preload或loadrdf工具将数据加载到graphdb时？

Dax MAXX引用度量值-不总是给出正确的结果

忽略Anylogic中的Hold对象

Facebook analytics Facebook Analytics-Has'；利益'；是否已从人口统计部分删除？

Paperjs 在不同大小的图纸视图上显示图形的最佳方法是什么？

Conda 如何追溯snakemake工作流中用于生成结果文件的确切软件版本

关于在Anylogic中获取多个资源的问题

DAX如何根据切片器的选定值调整日期

[python]相关推荐

为什么Borg模式比Python中的Singleton模式更好
Python

Python/PySerial与CPU使用
Python

在Python中将秒转换为hh:mm:ss
Python Django Time

Python异常：EAFP和什么是真正的异常？
Python Exception

Python zeromq持久性模式
Python

Python 将numpy数组列表合并为一个数组（fast）
Python Arrays Numpy

Python matplotlib中的TeX渲染、大括号和字符串格式语法
Python String Matplotlib

Python 如何显示小数点后两位的浮点？
Python String Floating Point

Python 如何使用Cython创建站dll
Python Dll

Python：如何在类实例之间传递变量或获取调用方？
Python Variables

Python构造函数和_init__
Python

Python 如何让matplotlib绘图超出轴？
Python Matplotlib

如何消除python windows文件路径字符串中的双反斜杠？
Python File Dictionary Path

Python 如何完全遍历未知深度的复杂字典？
Python Json Dictionary Python 2.7

在python中迭代未知数量的嵌套循环
Python List

如何在Cyberix3D网站上获取所有游戏的URL链接(http://www.3dgamemaker.com)使用Python 3.7.4和beautifulsoup4？
Python Python 3.x

Python 如何透视数据帧？
Python Python 3.x Pandas

Chaquopy:从python代码中读取文本文件时出错；没有这样的文件或目录；
Python Android

Python 从包含多个键值的两个列表中Dict
Python Dictionary

正则表达式正确分组，但python错误插入值？
Python Json Regex

Python 如何在seaborn implot中更改不同回归线的线样式？
Python

Python 尝试使用discord.py bot在语音频道之间移动用户
Python Discord.py

Python 如何求拟合多项式特征模型的回归曲线方程
Python Machine Learning Scikit Learn

Python 根据条件，用其他COL的平均值替换NaN值
Python Pandas Dataframe

Python 使用pytest.ini进行日志记录。如何附加到文件？
Python Logging

Python 什么是Keras ImageDataGenerator逻辑？
Python Keras Deep Learning

Python 在Django中简化表单提交
Python Django Forms Optimization

f2py:Python不导入模块
Python Fortran

_driver.cpython-36m-x86_64-linux-gnu.so:未定义符号：_ZN5boost6detail12set_tss_dataepkvpfvpfvpes3_ES5_S3_b 我试图运行英伟达的TySope的Python示例，但是导入PycUDA有一个错误：
Python Linux

iPython，保存代码单元的输出，并且在执行期间仍然正常显示输出
Python Ipython

Tags

Gitlab Itext Chart.js Jquery Ui Perforce Reactjs Dynamics Crm Design Patterns Netlogo Colors Reference Sockets Audio Web Applications Com Installation Mobile Generics List C++ Cli Amazon S3 Vhdl Xcode4 Google Cloud Storage Authentication Composer Php Sencha Touch Anaconda Gstreamer Subsonic Maven 2 Openerp Inheritance Google Cloud Dataflow Graphviz Eclipse Rcp Printing Apache Spark Linq To Sql Templates Cors Cocos2d Iphone Ruby On Rails 4 Caching Rss Socket.io Model Fiware Z3 Kubernetes Ada Mongodb Jboss Spring Mvc Prometheus File Io D3.js Rest Google Maps Api 3 Uitableview Android Layout Asp.net Mvc Latex Speech Recognition Gdb Ssl Phpmyadmin Entity Framework 4 Twitter Floating Point Npm Compilation Umbraco Windows Runtime Octave Xpath Quickbooks Winforms Junit React Native Markdown Datatables Transactions Asynchronous Xpages Https E Commerce Xamarin.forms Jakarta Ee Google Api Automation Gradle Inno Setup Directx Elixir Navigation Makefile Sublimetext3 Laravel Ruby On Rails 3.2 Abap Networking Django Rest Framework Jira Zurb Foundation Memory Django Models Mono Dart Terminal Prolog Uml Content Management System Sphinx Build Google Bigquery Openlayers 3 Visual Studio 2012 Imagemagick Ios6 Java Me Kernel Debugging Grid Arangodb Programming Languages Performance Sdk Browser Usb Apache Pig Msbuild Openssl Arrays Ms Office Forms Glassfish Ipython Playframework 2.0 Bazel Julia Sprite Kit Database Tags Clojure Spring Integration Couchdb Ios5 If Statement R Loops Typo3 Mod Rewrite Ibm Midrange Dom Validation Swiftui Identityserver4 Image Google Drive Api Kdb Xampp Azure Titanium Reporting Services Discord Login Dns Openshift C# Tkinter Ios8 Haskell Internationalization Streaming Internet Explorer 8 Jaxb Image Processing Uwp Servlets Centos Racket Google Apps Script Embedded Hive Cmake Moodle Directory Automated Tests Wix Ruby On Rails 3.1 Appium Mdx Firebase Sml Oracle10g 3d Drupal 6 Calendar Orientdb Filter

Copyright © 2024. All Rights Reserved by - Fatal编程技术网