Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/351.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 考虑到每个项目可以有多个主题,如何将数据集中每个项目的主题转换为特征向量_Python_Machine Learning_Feature Extraction_Feature Selection_Feature Engineering - Fatal编程技术网

Python 考虑到每个项目可以有多个主题,如何将数据集中每个项目的主题转换为特征向量

Python 考虑到每个项目可以有多个主题,如何将数据集中每个项目的主题转换为特征向量,python,machine-learning,feature-extraction,feature-selection,feature-engineering,Python,Machine Learning,Feature Extraction,Feature Selection,Feature Engineering,我有一个包含英语语句的数据集。每个语句都被分配了一系列与该语句相关的主题。主题可以是经济、体育、政治、商业、科学等。每个陈述可以有一个以上的主题。有些语句可以有1个主题,有些语句可以有2个主题,依此类推。对于语句本身,我使用TF-IDF向量将语句转换为特征向量。但是,我不知道如何将主题转换为用于机器学习培训的特征向量。您可以为每个主题创建一个二进制列,以显示语句是否具有此主题。您可以为每个主题创建一个二进制列,以显示语句是否具有此主题

我有一个包含英语语句的数据集。每个语句都被分配了一系列与该语句相关的主题。主题可以是经济、体育、政治、商业、科学等。每个陈述可以有一个以上的主题。有些语句可以有1个主题,有些语句可以有2个主题,依此类推。对于语句本身,我使用TF-IDF向量将语句转换为特征向量。但是,我不知道如何将主题转换为用于机器学习培训的特征向量。

您可以为每个主题创建一个二进制列,以显示语句是否具有此主题。

您可以为每个主题创建一个二进制列,以显示语句是否具有此主题