Python 为什么sklearn的TfidfVectorizer函数会给出这个结果?
我是一名新的数据科学专业的学生,我有一个主题提取项目要做,我正在使用sklearn的TfidfVectorizer功能,如果有人能帮我的话,我有一个小问题 代码如下:Python 为什么sklearn的TfidfVectorizer函数会给出这个结果?,python,text,scikit-learn,tf-idf,tfidfvectorizer,Python,Text,Scikit Learn,Tf Idf,Tfidfvectorizer,我是一名新的数据科学专业的学生,我有一个主题提取项目要做,我正在使用sklearn的TfidfVectorizer功能,如果有人能帮我的话,我有一个小问题 代码如下: from sklearn.feature_extraction.text import TfidfVectorizer import pandas as pd import numpy as np def tf_idf_fonc(documents): def dummy_fun(doc): return
from sklearn.feature_extraction.text import TfidfVectorizer
import pandas as pd
import numpy as np
def tf_idf_fonc(documents):
def dummy_fun(doc):
return doc
tfidf = TfidfVectorizer(
analyzer='word',
tokenizer=dummy_fun,
max_df=0.8,
min_df=0.15,
preprocessor=dummy_fun,
token_pattern=None,)
tfidf.fit_transform(documents)
return tfidf
def main():
df_bad_review = pd.read_csv('df_bad_review.csv')
documents = df_bad_review['text'].iloc[:2]
tf_idf = tf_idf_fonc(documents)
print(documents)
print(tf_idf.get_feature_names())
if __name__ == '__main__':
main()`
这就是结果: