Python ValueError:无法将字符串转换为浮点-机器学习

Python ValueError:无法将字符串转换为浮点-机器学习,python,machine-learning,scikit-learn,Python,Machine Learning,Scikit Learn,我正在进行一个机器学习项目,以确定PCAP是否为攻击,我必须处理PCAP文件,创建一个模型,然后进行预测。 我的部分代码如下所示: train['is_train']=np.random.uniform(0,1,len(train))您需要将您的分类特征编码为数值,有一些技术,例如和,它们是sklearn.preprocessing模块的一部分,允许您进行编码。因此,首先确定列车集中分类的列,并按照上述链接中所述进行虚拟编码,然后应用.fit()方法 有关更多实现详细信息,请参阅 希望这有帮助

我正在进行一个机器学习项目,以确定PCAP是否为攻击,我必须处理PCAP文件,创建一个模型,然后进行预测。 我的部分代码如下所示:


train['is_train']=np.random.uniform(0,1,len(train))您需要将您的分类特征编码为数值,有一些技术,例如和,它们是
sklearn.preprocessing
模块的一部分,允许您进行编码。因此,首先确定列车集中分类的列,并按照上述链接中所述进行虚拟编码,然后应用
.fit()
方法

有关更多实现详细信息,请参阅

希望这有帮助

这些被称为分类变量。在您的用例中,我建议使用
sklearn.preprocessor.OrdinalEncoder
将它们转换为整数编码数组,或者使用完全不同的分类器,例如默认情况下可以处理此类变量的
CatBoostClassifier
[['172.27.224.250' 16 'TCP' ... 1532299481617 60 54200]
 ['172.27.224.251' 24 'TCP' ... 1532299483068 60 502]
 ['172.27.224.251' 24 'TCP' ... 1532299483069 60 502]
 ...
 ['172.27.224.251' 24 'TCP' ... 1532301279315 60 502]
 ['172.27.224.250' 16 'TCP' ... 1532301279324 60 49713]
 ['172.27.224.250' 24 'TCP' ... 1532301279335 66 49713]]