Machine learning 如果标签已在列车数据集中定义,如何使用列车数据集预测测试数据集中的标签?

Machine learning 如果标签已在列车数据集中定义,如何使用列车数据集预测测试数据集中的标签?,machine-learning,nlp,data-science,data-analysis,Machine Learning,Nlp,Data Science,Data Analysis,假设我们有一个火车数据集,其中列是浴室、卧室、sqft living、view和一些其他功能,并且price在其中定义。 在测试数据集中,除价格外,所有上述特征都存在。 为什么我们可以从数据集预测价格?您可以使用您拥有的训练集训练模型,但如果您没有测试集的标签(基本事实),您将无法验证您的模型(使用训练集训练的模型)的性能.没有标签会使您的测试集无效,因此您可以将标签集(您在此处称之为训练数据)划分为训练集和测试集。这样,您就不会将所有数据用于培训,测试部分将用于模型的验证

假设我们有一个火车数据集,其中列是浴室、卧室、sqft living、view和一些其他功能,并且price在其中定义。 在测试数据集中,除价格外,所有上述特征都存在。
为什么我们可以从数据集预测价格?

您可以使用您拥有的训练集训练模型,但如果您没有测试集的标签(基本事实),您将无法验证您的模型(使用训练集训练的模型)的性能.

没有标签会使您的测试集无效,因此您可以将标签集(您在此处称之为训练数据)划分为训练集和测试集。这样,您就不会将所有数据用于培训,测试部分将用于模型的验证