如何在python中从头开始使用TF idf使朴素贝叶斯多项式?

如何在python中从头开始使用TF idf使朴素贝叶斯多项式?,python,naivebayes,multinomial,Python,Naivebayes,Multinomial,我知道python中有一个库 从sklearn.naive_bayes导入多项式nb 但我想知道如何在不使用TfIdfVectorizer和多项式nb之类的库的情况下从头开始创建一个MNB分类器?下面是关于如何使用TF-IDF制作简单MNB分类器的一步一步介绍 首先,您需要导入方法TfIdfVectorizer来标记数据集中的术语,多项式nb作为分类器,以及用于分割数据集的train\u test\u split。(这两种都可以在sklearn中获得) 将数据集拆分为训练和测试集 初始化Tf

我知道python中有一个库

从sklearn.naive_bayes导入多项式nb


但我想知道如何在不使用TfIdfVectorizer和多项式nb之类的库的情况下从头开始创建一个MNB分类器?

下面是关于如何使用TF-IDF制作简单MNB分类器的一步一步介绍

  • 首先,您需要导入方法TfIdfVectorizer来标记数据集中的术语,多项式nb作为分类器,以及用于分割数据集的train\u test\u split。(这两种都可以在sklearn中获得)

  • 将数据集拆分为训练测试

  • 初始化TfIdfVectorizer的构造函数,然后通过方法fit_transform序列集进行向量化/标记化

  • 使用Fit方法对测试集进行向量化/拟合

  • 通过调用构造函数多项式nb()初始化分类器

  • model=多项式nb()#带有默认超参数
    
  • 使用训练集训练分类器
  • model.fit(X\U系列、y\U系列)
    
  • 使用测试集测试/验证分类器
  • model.predict(X_检验,y_检验)
    

    以上7个步骤是简单的步骤。显然,您还可以进行文本预处理以及建模评估

    欢迎来到SO fik!您的意思是“我如何实现Naive Bayes+我如何实现TFIDF向量化器”还是“导入库后,我如何使模型适合数据?”我如何使用TFIDF实现Naive Bayes而不使用库TFIDFvectorier和多项式Nb(),但从零开始,这个问题太广泛,无法在这里回答,请查看。对于多项式朴素贝叶斯的概述,有一个工作示例,以及。两者都解释了单词袋(
    CountVectorizer
    )模型的朴素贝叶斯,但它们的实现将等同于TFIDF矢量器。我不是说使用TfIdfVectorizer和多项式NB()之类的库,而是指如何从头开始构建它们