Python 如何为列车和测试集分别标记多列编码_Python_Scikit Learn - Fatal编程技术网

Python 如何为列车和测试集分别标记多列编码

python scikit-learn

Python 如何为列车和测试集分别标记多列编码,python,scikit-learn,Python,Scikit Learn,我正在建立一个随机森林模型，在我的训练数据集中有3个分类变量。sklearn RandomForest不允许在模型中使用分类变量我使用Labelencoder（）在火车集上使用fit_变换将这些变量转换为数值变量，但在测试集上运行变换时出错 from sklearn.preprocessing import LabelEncoder le = LabelEncoder() X_train.apply(le.fit_transform) X_test.apply(le.transform)

我正在建立一个随机森林模型，在我的训练数据集中有3个分类变量。sklearn RandomForest不允许在模型中使用分类变量

我使用Labelencoder（）在火车集上使用fit_变换将这些变量转换为数值变量，但在测试集上运行变换时出错

from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()
X_train.apply(le.fit_transform)

X_test.apply(le.transform)

我收到以下错误消息：

ValueError:（“y包含新标签：[“女性”“男性”]，“发生在索引性别”）

似乎您的

Sex

列中有一个输入错误，其中一个值似乎是

[“女性”“男性”]

而不是

[“女性”，“男性”]

（请注意，在前者中，这两个值不是用逗号分隔的，因此不能作为单独的元素来读取）。请确保在应用

train\u test\u split

或以任何方式分割数据之前先修复该错误。例如，您可以查看

df.Sex.unique（）

（其中

df

是您的数据集），并确保只有期望值

[“男性”、“女性”]

潜在的错误是

LabelEncoder

在

X\u测试中发现了一个在X\u序列中找不到的值，因此它不知道如何转换它（因为您只在X\u序列中找到的值上安装LabelEncoder
）。只有在数据集中存在非常罕见的值时才会发生这种情况（在这种情况下，您可能需要重新考虑数据，或以适当的方式重新处理数据），但如果您想完全避免这种情况，一个可行的选择是在将数据拆分为训练和测试
之前安装LabelEncoder
。请提供一个解决方案，以便有人能够找出如何重现您的问题并确定解决方案。




[scikit learn]相关文章推荐



                                                        
Scikit learn scikit学习中的成本敏感性分析
scikit-learn 
Scikit learn 在scikit学习中保存矢量器
scikit-learn 
Scikit learn 是否有任何scikit学习工具可用于实现遗传算法？
scikit-learn 
Scikit learn 主题建模nmf/lda scikit学习
scikit-learn 
Scikit learn scikit learn和glmnet中的弹性网络是否等效？
scikit-learn 
Scikit learn 如何将文本传递给sklearn.feature\u extraction.text.tfidfvectorier
scikit-learn 
Scikit learn 如何解决svm拟合误差？
scikit-learn 
Scikit learn 使用类权重的网格搜索和KerasClassifier
scikit-learnkeras 
Scikit learn ScikitLearn'使用的是哪种激活方式；输出层中的MLPClassifier？
scikit-learnneural-network 
Scikit learn 线性回归中的截距
scikit-learn 
Scikit learn RandomForestRegressor：关于输出、参数和执行时间的问题
scikit-learn 
Scikit learn Scikit学习计数向量器：定制预处理器、标记器和分析器
scikit-learn 
                                       





随机文章推荐



                                                        
如何在生产web服务器上测试Apache/mod_Perl下的web Perl模块？
perlapachetesting 
Perl 如何为CGI脚本模拟队列？
perl 
Perl 需要文字检测子程序的帮助吗
perldictionary 
perl脚本中已知错误的未知原因
perl 
Perl 是否可以为system（）调用创建读/写文件句柄？
perl 
使用Perl DBI执行整个SQL文件，就像在Oracle SQL Developer中一样
perloracle 
Perl 使用WWW:：Mechanize/：：GZip处理GZip压缩的web内容
perl 
将文本集合转换为向量表示的Perl脚本
perl 
使用perl实现GUI自动化的工具
perl 
Perl 是什么导致这些DBD:：SQLite错误？
perl 
循环结束后的操作（perl脚本）
perl 
如何使用perl将excel文件上的输出打印到每一列？
perl 
Perl 6中的重载常量
perl 
使用Perl脚本比较两个文件
perlawk 
Perl解压/动态命名和错误处理
perl 
无法在Windows 64位上安装Net:：SSH:：Perl模块
perlssh 
如何手动（即脱机）安装Redis perl库？从哪里可以获得所有要安装的依赖项
perlredis 
Perl替换参数
perl 
使用Perl'；s File:：Basename以重命名文件扩展名
perl 
Perl 如何使用“共享模块”；我们的"；来自不同来源的变量？
perl


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
如何从图像文件夹中生成python中的电影带图像？
									Python
							 									Django
							 									Image
							 
Python Twitter数据挖掘：分离度
									Python
							 									Twitter
							 
Python 在Django中，我应该如何按项目类别组织项目列表？
									Python
							 									Django
							 									Templates
							 									Loops
							 
Python 学生小组之间的代码共享
									Python
							 									Eclipse
							 
Python 在matplotlib中对齐TeX方程
									Python
							 									Math
							 									Matplotlib
							 
Python 了解django loaddata或为修复程序转储数据的正确方法
									Python
							 									Django
							 
在Python子流程模块中使用git筛选器分支
									Python
							 									Git
							 
Python中的GAE就绪异步操作？
									Python
							 									Http
							 									Google App Engine
							 									Asynchronous
							 
Python Openerp中的Onchange函数
									Python
							 									Xml
							 									Openerp
							 
Python Django：收集用户、对象和活动流
									Python
							 									Django
							 
Python 在重构文本中创建编号列表
									Python
							 									Python Sphinx
							 
惯用python，管理函数中的默认参数
									Python
							 
Python Heroku R10启动超时错误
									Python
							 									Web Applications
							 									Heroku
							 									Flask
							 
绕过Python Scapy中的一些数据包层
									Python
							 									Python 2.7
							 
Python 下采样非均匀一维信号
									Python
							 									Numpy
							 
Python 如何从字符串末尾提取数字
									Python
							 									Regex
							 									String
							 									Python 3.x
							 
Python 循环迭代元组
									Python
							 									For Loop
							 									Dictionary
							 
Python 将乘法结果保存到现有数组
									Python
							 									Arrays
							 									Numpy
							 
Python：创建一个在任何函数调用中都不返回任何值的类
									Python
							 									Function
							 									Class
							 
什么'；在python中准备返回矩阵的好处是什么？
									Python
							 									Numpy
							 									Matrix
							 
Python 使用带theano的多处理
									Python
							 									Multithreading
							 									Keras
							 
Python 如何在数据帧上执行字符串操作
									Python
							 									Pandas
							 
Python 如何从堆栈交换站点获取数据
									Python
							 									Scrapy
							 
python如何在不从列表中删除元素的情况下按事件对列表进行排序？
									Python
							 									Python 2.7
							 									List
							 									Sorting
							 
Python 复制数据帧只为具有相同索引的行保留最大值
									Python
							 									Pandas
							 									Dataframe
							 
用Python中的PEP 8标准声明类对象（pylint错误）
									Python
							 
python manager.dict（）锁定的工作原理：
									Python
							 									Python 2.7
							 
X[，y]表示在python中是什么意思？
									Python
							 
Python 在sklearn.preprocessing模块中，我得到了ValueError:找到了具有0个功能的数组
									Python
							 									Python 3.x
							 									Scikit Learn
							 
Python 使用熊猫石斑鱼时，如何获取序列的最大值？
									Python
							 									Pandas
							 									Dataframe
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Instagram
Resharper
Maven 2
Tridion
Drupal
Mule
Dialogflow Es
Parse Platform
Coding Style
Opencart
Antlr
Corda
Sms
Sqlalchemy
Azure Data Factory
Phpunit
Uwp
Session
Javafx 2
Directory
Windows Phone 8.1
Opengl Es
Design Patterns
Jboss
Variables
Dependencies
Fortran
C
Entity Framework Core
Kentico
Nunit
Ruby
Xampp
Sencha Touch
Alfresco
Websphere
Elm
Dom
Weblogic
Ios4
Moodle
Visual Studio 2010
Single Sign On
Google Chrome
Mono
Amp Html
File Upload
Rx Java
Oauth 2.0
Testng
Properties
Socket.io
Network Programming
Twitter Bootstrap
Liferay
Exception
Merge
Symfony1
Floating Point
Amazon Dynamodb
Windows Installer
Asp.net Mvc 3
Struct
Compression
Internet Explorer 8
Wcf
Hazelcast
Macos
Neo4j
Authentication
Xquery
Inheritance
Database
Yii2
Netlogo
Amazon Ec2
Servlets
Artifactory
Vbscript
Google Cloud Storage
Doxygen
Gstreamer
Ios6
Html5 Canvas
Powerbi
Npm
Webpack
Gwt
Loopbackjs
Discord.py
Directx
Talend
Computer Science
Junit
Ios
Asp.net Mvc 5
Vuejs2
Gridview
Graph
Sip
Database Design
Scroll
Ignite
Graphics
Web Crawler
Linkedin
Mqtt
Unicode
Visual Studio 2012
Protractor
Azure Active Directory
Gatsby
Apache Kafka
Cuda
Sorting
Joomla
Synchronization
Web Scraping
Video Streaming
E Commerce
Flutter
Serial Port
Join
Virtual Machine
Imagemagick
Java 8
Clang
Pandas
Nsis
Canvas
Playframework 2.0
Lambda
Speech Recognition
Javascript
Arrays
Ftp
Gtk
Jaxb
Modelica
Smalltalk
Shiny
Drop Down Menu
Ssl
Build
Import
Excel
Macros
Testing
Facebook Graph Api
Tabs
Ssas
If Statement
Yocto
Datatables
Jar
Entity Framework 4
Linq To Sql
Camera
Here Api
Winforms
R
Math
Ms Access
Generics
Routing
Mercurial
Post
Ssh
Hive
Encoding
Doctrine Orm
Mips
Ruby On Rails 3
Openshift
Arm
Menu
Ecmascript 6
Opencv
Java
Ionic Framework
Xamarin.forms
Transactions
Mongodb
Windows Runtime
Ios8
Hybris
Docker
Libgdx
Flask
Pycharm
Cmd
Emacs
Tkinter
Bluetooth
Windows
Python 2.7
Jhipster
Autodesk Forge
Llvm
Scrapy
Orchardcms


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网