Classification 具有大量缺失数据的分类_Classification_Svm_Missing Data - Fatal编程技术网

Classification 具有大量缺失数据的分类

Classification 具有大量缺失数据的分类,classification,svm,missing-data,Classification,Svm,Missing Data,当建立一个模型来分类一个学生是否会被某个特殊项目录取时，主要特征包括： gender | Ethnicity | State | Zip code | Test score | Education | Job title | Current gpa | Admission 由于数据是在线收集的，因此许多功能缺少大量数据。特征“测试分数”对录取决定应该很重要，但它忽略了大约80%。似乎插补是不实际的是否应将其作为一个特征，并使用EM或贝叶斯网络、SVM等对缺失数据不敏感的算法，或在建立模型时直

当建立一个模型来分类一个学生是否会被某个特殊项目录取时，主要特征包括：

gender | Ethnicity | State | Zip code | Test score | Education | Job title | Current gpa | Admission

由于数据是在线收集的，因此许多功能缺少大量数据。特征“测试分数”对录取决定应该很重要，但它忽略了大约80%。似乎插补是不实际的

是否应将其作为一个特征，并使用EM或贝叶斯网络、SVM等对缺失数据不敏感的算法，或在建立模型时直接删除该特征？有什么建议吗？

您应该放弃该功能。只有20%的分数存在，考试分数无法平均。也不能添加具有分布的随机值，因为它们是测试分数

您可以尝试用包含这些值的行构建一个模型，看看它是否有效。
您可以尝试通过linkedin寻找更多数据，或者通过发布研究官方信函与招生服务联系，并且您不会共享任何数据。我还认为你可以去掉邮政编码或州，因为两者都表示几乎相同的东西。谢谢你的建议。是的，我只使用了邮政编码和一个热编码。至于收集更多数据，这是一个很好的方法，但不适用于这个特定问题。谢谢。我将探讨这两种方法，填充缺失的值，然后构建模型，另一种方法是删除此功能并构建模型。

[bash]相关文章推荐

Bash 在同一行上继续输出 bash

从bash脚本调用make赢得'；做不到 bash shell makefile

vi模式下转义点的bash/readline等价物 bash

Bash 谷歌应用程序脚本认证 bash curl google-apps-script

在特定行中搜索范围内的值。Unix bash脚本 bash unix awk

Bash 如何在字符串上使用sed？ bash awk

Bash Shell脚本使用参数调用Jar—文件名列表被视为一个字符串 bash shell

Bash 无法解析从XML读取的Unix命令 bash unix

在bash循环数组中使用通配符 bash loops

Bash 仅在具有特定UID或GID的文件上运行chown bash

Bash 获取并处理每行的最后一个单词，同时在文本行中循环 bash

Bash npm运行脚本转义用户提供的带有单引号的参数 bash npm

Bash 如何获取hiveQL脚本所占用的时间 bash shell unix hadoop hive

Bash 如果在源脚本时比较失败 bash unix zsh

Bash 基于词匹配的文件替换 bash awk sed

Bash rm-r-f不'；不要删除内部文件夹 bash makefile scripting cygwin

Bash 使用pkill，我如何找出匹配的进程数 bash

Bash tcl或sed或shell搜索替换多行 bash perl sed tcl

Bash 卷发帖中的特殊字符 bash curl apache-nifi

Bash 检查目录中是否存在文件 bash shell

随机文章推荐

Maven APT页面中的占位符替换 maven

如何在Maven中自动加载本机依赖项？ maven

Maven IntellijIDEA 11中的JSF2支持 maven jsf-2 intellij-idea

Maven jJenkins-生成后清空工作区 maven jenkins

在ApacheMaven中，是否可以控制文件添加到存档的顺序？ maven

在STS中实现Maven时遇到问题 maven path

Maven 使用通配符在文件存在时激活配置文件 maven cucumber

Maven 如何从插件获取Nexus索引内容 maven plugins

Maven 降低声纳2.1.x中的日志级别 maven jenkins sonarqube

如何运行Selenium+；Maven在pom.xml中提到的特定浏览器上进行测试？ maven selenium testng

Maven忽略存储库 maven

在maven程序集中复制文件 maven

如何在maven构建期间创建包含所有模块内容的附加jar文件？ maven jar

如何使用Maven汇编插件将webapp目录中的文件添加到jar？ maven jar

Maven 使用汇编插件从Nexus打包jar maven maven-2

Maven 未找到依赖javax.mail:mail:1.4 maven dependencies

Maven 如何在pom.xml中正确排除springboot执行器 maven spring-boot

Maven github操作中本地安装的jar依赖项 maven spring-boot

ant和maven不在jenkins slave工作 maven jenkins ant

我可以使用maven和依赖性检查maven插件来验证ear文件的内容吗？ maven

[ip]相关推荐

将子域绑定到IP
Ip

Ip 连接问题-tcpdump报告ping成功，ping本身没有成功
Ip

Ip 路由器将如何转发发送到以下地址的数据包
Ip

Ip STUN协议是否在NAT内转发数据包？
Ip

用于天气学的静态公共Ip
Ip

Tags

Visual C++ Nhibernate Azure Cosmosdb Jekyll Phpstorm Bluetooth Ionic Framework Kotlin Opencv Orm Asp.net Core Mvc Rdf Less Google Drive Api Webrtc Ant Report Snmp Logic Mobile Azure Wcf Neural Network Matrix Jenkins Ios6 Odata Loops Xmpp Sapui5 Jquery Plugins Couchbase Keycloak Sequelize.js Ruby On Rails 3.1 Variables Visual Studio 2017 Sugarcrm Stanford Nlp Dns Twitter Android Emulator Yii2 Select Azure Sql Database Ruby On Rails 3 Resharper Identityserver4 Linker Canvas Jestjs Methods Mapreduce Colors Jboss Windbg Netbeans Join Time Complexity Apache Flex Api Single Sign On Clang Crystal Reports Influxdb Azure Functions Html Google App Engine Fiware Jupyter Notebook If Statement Entity Framework Core Sharepoint 2013 Sphinx Vhdl Ssl Pandas Modelica Sql Server 2005 Silverstripe Datatables For Loop Here Api Google Analytics Three.js Filesystems Matlab Glsl Imagemagick Google Sheets Functional Programming Internet Explorer 8 Vector Model Automation Pointers Rspec Random Tinymce Cocoa Iphone Rust Jakarta Ee Ibm Mobilefirst Eclipse Twitter Bootstrap 3 Shopify Instagram Laravel 5 Mule Tabs Inheritance Next.js Autocomplete E Commerce Scripting Drupal 6 Character Encoding Jar Session Cucumber Inno Setup Xpages Db2 Arm Csv Ftp Sqlite Jasper Reports Antlr4 Tsql .net 4.0 Transactions Artificial Intelligence Kdb Notepad++ Gmail Azure Service Fabric Wordpress Jetty Pdf Entity Framework Twig Language Agnostic Gruntjs Import Amazon Web Services Puppet Perl Compiler Errors Rally Deep Learning Protocol Buffers Database Design Tree Sms Actionscript Visual Studio Mod Rewrite Alfresco Windows Runtime Image Ibm Midrange Embedded Sbt Gdb Streaming Ms Access Cookies Extjs4 Templates 3d Geometry Continuous Integration Database Mariadb Content Management System Multithreading Virtual Machine Udp Npm Flask Talend Gnuplot Opencl Plone Netty Unity3d Coq Data Binding Mongoose Orchardcms Github Indexing Zurb Foundation Wix Cocos2d X Swift Isabelle Redis Formatting

Copyright © 2024. All Rights Reserved by - Fatal编程技术网