Python 如何对游戏数据进行预处理-k-均值_Python_Cluster Analysis_Data Mining_K Means - Fatal编程技术网

Python 如何对游戏数据进行预处理-k-均值

python

Python 如何对游戏数据进行预处理-k-均值,python,cluster-analysis,data-mining,k-means,Python,Cluster Analysis,Data Mining,K Means,我有一个用户分数表，如下所示： user_id score duration_of_per_play start_date 1 56 313 2018-01-09 2 14 560 2018-08-01 1 56 113 2018-01-09 4 14 340 2018-

我有一个用户分数表，如下所示：

user_id  score duration_of_per_play  start_date
  1        56    313                 2018-01-09
  2        14    560                 2018-08-01
  1        56    113                 2018-01-09
  4        14    340                 2018-08-01
....

现在我想使用

k-means

算法对用户集群进行分类。只是我知道我没有

缺失值

和

异常值

但我不知道：

下一步是什么

我需要对数据进行

居中吗


我有42000张这场比赛的记录。我想根据得分和每次播放的持续时间对用户进行聚类
K-means本身不需要预先居中，但由于使用的功能规模不同，您将从标准化数据中获益。

因此，我建议减去平均值并除以STD（当然是每个轴），然后只使用许多k-平均值实现中的一种。

我也读过关于k-means和关于选择集群数量、处理异常值等的不同选项，但这并不是你问的“下一步”。

祝你好运

这是一个很好的实现，您可以从它开始：
您是否有异常值和/或缺失值？创建一个特征向量（可能是其中的一行）并将其填充到一个列表中。估计的平均值（KMeans类的属性）将生成您的结果。注1：不需要，您不需要将数据集中。注2：检查这是否真的符合您的需要。@Shlomif谢谢您的评论，我对异常值进行预处理，并且没有任何缺失值，因为我从API中收集了这些记录，所有验证都完成了。是的。但同样，一些预处理可以有所帮助。我的回答有用吗？




[localization]相关文章推荐



                                                        
Localization 用其他（口语）语言编码
localization 
Localization 在EPiServer文件管理器中本地化XForms
localization 
Localization AppStore-In-App-Purchase：如何获取用户将使用的货币？
localization 
Localization 如何在Middleman中将本地化（i18n）与Haml结合使用
localizationinternationalization 
Localization 如何合并两个.po文件？
localizationinternationalization 
Localization preferencesfragment中多选对话框上的自定义取消按钮
localization 
Localization KDE中的错误/混合语言
localization 
Localization 标记逻辑中的本地化
localizationmarklogic 
Localization 将文本转换为不同的语言
localizationinternationalization 
Localization 嵌入式脚本语言的编译时本地化
localization 
Localization 通过消除重力估计用户速度的加速度动态分量
localization 
                                       





随机文章推荐



                                                        
Xpages 如何在不同的数据库中使用@DbLookups
xpages 
Xpages中的视图过滤
xpages 
Xpages styleClass属性在InputField.EditBox的主题中不起作用
xpages 
将xpages字段值动态绑定到后端文档的最佳方法
xpages 
XPages自定义错误页-获取错误消息和行
xpages 
XPages@DbLookup在查看其他服务器/数据库时返回未定义
xpages 
Xpages 在视图中搜索结果会导致xpage为空
xpages 
Xpages 使用view.PostScript从SSJS调用partialRefreshGet
xpages 
如何为XPages REST服务startKeys创建向量？
xpages 
Xpages Notes/iNotes日历日期选择器导航
xpages 
Xpages 当动态组合框的项目得到更新时，它不会更新其绑定scopevar
xpages 
Xpages 如何将notes视图转换为html嵌套列表？
xpages 
Xpages 在读取模式下，如何将组件绑定到后端文档而不是bean？
xpages 
Xpages 从包含2个RTF字段的表单中获取AttachmentName
xpageslotus-notes 
Xpages 我可以在类别也是文档的情况下创建一个分类视图吗
xpageslotus-notes 
安装Xpages调试工具栏时出现问题
xpages 
Xpages currentDocument.isNewNote（）的表达式语言
xpages 
在XPages中加载视图花费的时间太长
xpages 
Xpages 如何加快我的Xagent？
xpages 
基于xPages的论坛
xpages


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 如何在GAE'中检索记录的最新版本；s的高复制数据存储？
									Python
							 									Google App Engine
							 
带时间戳的Python名称jpg
									Python
							 
Python脚本在进程完成之前无法读取Popen输出（在Windows上）
									Python
							 									Windows
							 									Python 2.7
							 									Tkinter
							 
Python django多对多字段注释和计数
									Python
							 									Django
							 
Python Spotfire自动导出
									Python
							 
Python 用户从shell执行的pelican可执行脚本是什么？
									Python
							 
Python 在Django下执行长时间运行的任务/批处理的健壮方法是什么？
									Python
							 									Django
							 
Python 如何在单击保存按钮时使用ORM方法？
									Python
							 									Xml
							 									Odoo
							 
Python 在金字塔应用程序中登录到SQLAlchemy logger
									Python
							 									Logging
							 									Sqlalchemy
							 
Python 虽然表中没有空值，但仍提取空td值
									Python
							 									Html
							 									Web Scraping
							 									Scrapy
							 
Python脚本中的多线程
									Python
							 									Multithreading
							 									Python 2.7
							 									Numpy
							 
Go中的Python列表理解
									Python
							 									Go
							 
在Tkinter按钮内更新Python上dict中的值
									Python
							 									Dictionary
							 									Tkinter
							 
Python 如何注册MultipleModelAPIView？
									Python
							 									Django
							 									Python 2.7
							 
Python 选择被OS信号中断后，Psycopg2连接不可用
问题
									Python
							 									Postgresql
							 									Python 2.7
							 
Flask无法在python3.4中导入名称应用程序
									Python
							 									Flask
							 
对于串联的循环–；初级python练习
									Python
							 									Python 3.x
							 									If Statement
							 									For Loop
							 
Python 将文件作为子进程打开
									Python
							 									Multithreading
							 
python-performance-sqlite3或大型字典列表
									Python
							 									Mysql
							 									Dictionary
							 									Sqlite
							 
Python TypeError:attr'的数据类型float32；T'；不在允许值列表中：int32、int64
									Python
							 									Tensorflow
							 
在Alexa-Python中，调用远程端点时出错，返回HTTP 404:NOT FOUND
									Python
							 
Python subprocess.CalledProcessError:命令返回非零退出状态1
									Python
							 
Python 在CNN训练期间使用numpy重塑图像阵列时出错
									Python
							 									Machine Learning
							 									Tensorflow
							 
Python 宽度优先搜索函数的列表索引超出范围错误
									Python
							 									Numpy
							 
Python 有没有更好的方法来展平和重建嵌套dict
									Python
							 									Dictionary
							 
Python Textract不支持的文档异常
									Python
							 
Python 如何通过查找列表和其他列之间的最佳匹配来填充列？
									Python
							 									Python 3.x
							 									Regex
							 									Pandas
							 									Dataframe
							 
python中的modulenotfounderror：没有名为'；json'；
									Python
							 									Json
							 									Import
							 									Module
							 
Python 如何让单个云运行实例（使用Gunicorn sync workers）处理来自发布/订阅的多个POST请求？
脚本
									Python
							 									Flask
							 									Google Cloud Platform
							 
Pandasql:Python int太大，无法转换为SQLite整数
									Python
							 									Pandas
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Spring Integration
Cocoa Touch
Ms Office
Phantomjs
Angular Material
Prestashop
Sqlite
Networking
Activemq
Linux
Pyspark
Iis 7
Vmware
Typo3
C# 3.0
Ms Access
Pentaho
Django Rest Framework
Composer Php
Datetime
Asterisk
Apache Spark
Opencart
Extjs4
Hbase
Directx
Jmeter
Meteor
Web Applications
Dart
Codeigniter
Error Handling
Socket.io
Devexpress
Java Me
Kendo Ui
Workflow
Gnuplot
Google Cloud Firestore
Deployment
Math
Computer Vision
Tinymce
Pip
Actionscript 3
Delphi
Windows Phone 7
Google Cloud Dataflow
Report
Markdown
Apache Kafka
Stm32
Session
Openlayers
Orm
Amp Html
Sphinx
Import
Drools
Snmp
Single Sign On
Windows
Nosql
Vbscript
Elm
Mongoose
Sails.js
Excel Formula
Triggers
Llvm
Instagram
Asp.net
Google Visualization
Enums
Visual Studio
Webrtc
Ecmascript 6
Rust
Sip
Leaflet
Firefox Addon
Dynamics Crm 2011
Outlook
Exception
Virtual Machine
List
Uml
Applescript
Google Chrome Devtools
Intellij Idea
Jar
Layout
Android Layout
Flask
Backbone.js
Xampp
Xmpp
Certificate
Ubuntu
Titanium
Xpath
Plot
Sencha Touch
Json
Sml
Usb
Maps
Highcharts
Protocol Buffers
Ant
Opengl Es
Udp
Permissions
Service
Recursion
Umbraco
Silverstripe
Perforce
Tabs
Artifactory
Youtube Api
Gridview
Google Maps
Sas
Teamcity
Notepad++
Tags
Unix
Ios6
Ms Word
Apache2
Xcode4
Objective C
Laravel 4
Ldap
Twitter
Ibm Midrange
Sublimetext2
Orientdb
Erlang
Vaadin
Sublimetext3
Sql Server
Couchbase
Terminal
Asp.net Core Mvc
Mips
Pointers
Swift2
Jestjs
Asp.net Mvc 2
Scala
Openerp
Wso2
Tridion
Kotlin
Visual Studio 2015
Amazon Web Services
Clang
Batch File
Google App Engine
Sql Server 2008
Io
Scrapy
Gis
Kubernetes
Vagrant
C++ Cli
Mod Rewrite
Database Design
Drop Down Menu
Antlr4
Html5 Canvas
Dojo
Symfony1
Asp.net Mvc 5
Linq To Sql
Hash
Jhipster
Coldfusion
Asp.net Web Api
Stripe Payments
Interface
C#
Amazon Cloudformation
Time
Terraform
Xamarin.android
Phpstorm
Seo
Google Apps Script
Swing
Responsive Design
Sharepoint 2007
Xsd
Autohotkey
Sharepoint 2010
Latex
Drupal
Centos
Collections


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网