Python 为什么sklearn的TfidfVectorizer函数会给出这个结果?

Python 为什么sklearn的TfidfVectorizer函数会给出这个结果?,python,text,scikit-learn,tf-idf,tfidfvectorizer,Python,Text,Scikit Learn,Tf Idf,Tfidfvectorizer,我是一名新的数据科学专业的学生,我有一个主题提取项目要做,我正在使用sklearn的TfidfVectorizer功能,如果有人能帮我的话,我有一个小问题 代码如下: from sklearn.feature_extraction.text import TfidfVectorizer import pandas as pd import numpy as np def tf_idf_fonc(documents): def dummy_fun(doc): return

我是一名新的数据科学专业的学生,我有一个主题提取项目要做,我正在使用sklearn的TfidfVectorizer功能,如果有人能帮我的话,我有一个小问题

代码如下:

from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
import numpy as np

def tf_idf_fonc(documents):

    def dummy_fun(doc):
       return doc
   
    tfidf = TfidfVectorizer(
            analyzer='word',
            tokenizer=dummy_fun,
            max_df=0.8,
            min_df=0.15,
            preprocessor=dummy_fun,
            token_pattern=None,)     
    
    tfidf.fit_transform(documents)
    
    return tfidf 
     

def main():

    df_bad_review = pd.read_csv('df_bad_review.csv')    
    documents = df_bad_review['text'].iloc[:2]    
    tf_idf = tf_idf_fonc(documents)
    print(documents)
    print(tf_idf.get_feature_names())
    

   
if __name__ == '__main__':
    main()`
这就是结果: