Python 为什么sklearn的TfidfVectorizer函数会给出这个结果？_Python_Text_Scikit Learn_Tf Idf_Tfidfvectorizer

Python 为什么sklearn的TfidfVectorizer函数会给出这个结果？

python text scikit-learn

Python 为什么sklearn的TfidfVectorizer函数会给出这个结果？,python,text,scikit-learn,tf-idf,tfidfvectorizer,Python,Text,Scikit Learn,Tf Idf,Tfidfvectorizer,我是一名新的数据科学专业的学生，我有一个主题提取项目要做，我正在使用sklearn的TfidfVectorizer功能，如果有人能帮我的话，我有一个小问题代码如下： from sklearn.feature_extraction.text import TfidfVectorizer import pandas as pd import numpy as np def tf_idf_fonc(documents): def dummy_fun(doc): return

我是一名新的数据科学专业的学生，我有一个主题提取项目要做，我正在使用sklearn的TfidfVectorizer功能，如果有人能帮我的话，我有一个小问题

代码如下：

from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
import numpy as np

def tf_idf_fonc(documents):

    def dummy_fun(doc):
       return doc
   
    tfidf = TfidfVectorizer(
            analyzer='word',
            tokenizer=dummy_fun,
            max_df=0.8,
            min_df=0.15,
            preprocessor=dummy_fun,
            token_pattern=None,)     
    
    tfidf.fit_transform(documents)
    
    return tfidf 
     

def main():

    df_bad_review = pd.read_csv('df_bad_review.csv')    
    documents = df_bad_review['text'].iloc[:2]    
    tf_idf = tf_idf_fonc(documents)
    print(documents)
    print(tf_idf.get_feature_names())
    

   
if __name__ == '__main__':
    main()`

这就是结果：