Python tfidf在装配到列车数据后如何转换测试数据？_Python_Scikit Learn_Tfidfvectorizer - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/329.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python tfidf在装配到列车数据后如何转换测试数据？_Python_Scikit Learn_Tfidfvectorizer - Fatal编程技术网

Python tfidf在装配到列车数据后如何转换测试数据？

python scikit-learn

Python tfidf在装配到列车数据后如何转换测试数据？,python,scikit-learn,tfidfvectorizer,Python,Scikit Learn,Tfidfvectorizer,我正在使用以下代码： pipeline = Pipeline([('vect', TfidfVectorizer( ngram_range=(1,2), stop_words="english", sublinear_tf=True ,

我正在使用以下代码：

pipeline = Pipeline([('vect', 
                      TfidfVectorizer( ngram_range=(1,2),
                                       stop_words="english", 
                                       sublinear_tf=True ,
                                       use_idf=True, 
                                       norm='l2' )),
                     ('reduce_dim',
                      SelectPercentile(f_classif, 90)),
                     ('clf', 
                      SVC(kernel='linear',C=1.0, 
                          probability=True, max_iter=70000, 
                          class_weight='balanced'))])

model = pipeline.fit(X_train,y_train)
model.predict(X_test)

x=vectorizer.fit_transform(X_train_text)
y=vectorizer.transform(X_test_text)

根据我的理解，

pipeline.fit（）

将tfidf适配到列车数据，当在

X\u测试中调用model.predict（）
时，它仅基于适配的列车数据执行tfidf转换
由于tf idf通过获取文档和语料库中单词的频率来工作，我想知道.fit\u transform
和.transform
函数下面会发生什么。
1）非常接近您的问题，您可以在这里找到：
2） tfidf变换是在fit transform
内部完成的，这里的predict
与tfidf矢量器不对应，因为它没有这样的功能，它是SVC的方法。
是fit（）
和fit\u transform（）
的基本文档
你对工作的理解是正确的。测试时，为tf idf矢量器设置参数。这些参数被存储起来，稍后用于转换测试数据

训练数据-fit\u transform（）
测试数据-transform（）

如果您想查看内部加工，您应该查看相同的内部加工




[scikit learn]相关文章推荐



                                                        
Scikit learn 二元向量作为roc_曲线的y_分数参数
scikit-learn 
Scikit learn 稀疏支持向量机对CV实例的预测概率很小
scikit-learn 
Scikit learn 最适合简历、文档匹配
scikit-learn 
Scikit learn 如何将sklearn的分类报告用于keras模型？
scikit-learnkeras 
Scikit learn 当数据行数小于列数时，PCA和KernelPCA将做什么？
scikit-learn 
Scikit learn 感知器在线培训（scikit学习）
scikit-learn 
Scikit learn 将新文档添加到术语文档矩阵以进行相似性计算
scikit-learnnlp 
Scikit learn 通过sklearn中的网格搜索和管道获得适当的交叉验证分数
scikit-learn 
Scikit learn Statsmodel在逻辑回归中跳过一个值？
scikit-learn 
Scikit learn 特征重要性的计算值
scikit-learn 
Scikit learn Kaggle内核未使用GPU
scikit-learn 
Scikit learn 在分类树中定义数据：有序与标称
scikit-learn 
                                       





随机文章推荐



                                                        
Logic 逻辑/概率问题：从袋子中挑选
logic 
Logic 竞赛游戏中的敌车移动逻辑
logic 
Logicmonitor-如何使用API获取角色列表？
logic 
Logic 如何导出四位偶数函数？
logic 
Logic 计算机体系结构.布尔函数
logic 
Logic 有没有可以在古典逻辑中证明但在Agda中不能证明的命题
logic 
Logic 如何在不使用乘法算子的情况下生成两个正数相乘的递归函数
logic 
Logic 将非规范化文件转换为规范化表的COBOL逻辑
logiccobol 
Logic 为什么量词的顺序很重要？如何确定订单？
logic 
Logic NuSMV模型检查中的错误？
logic 
Logic 在farmer Astronout中形成逻辑
logiccoq 
Logic VHDL中的4位Johnson计数器
logicvhdl 
Logic 生成以任意组合组合在一起时引用种子的键
logic 
Logic 顺序逻辑与可读性
logic 
Logic 使用mux创建1位比较器
logic 
Logic Z3中的平等与双条件
logicz3


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Routing
Jasper Reports
Jekyll
Xquery
Generics
Ruby On Rails 3.2
If Statement
Macros
D
Symfony1
Navigation
Umbraco
Adobe
Jakarta Ee
Sql
Cron
Marklogic
Windows Phone
Lucene
Office365
Python 3.x
Codenameone
Concurrency
Debian
Visual Studio 2015
Gatsby
Doctrine
Netlogo
Sip
Aws Lambda
Ms Office
Stripe Payments
Prometheus
Streaming
User Interface
Xsd
Mpi
Spring Mvc
Magento2
Wicket
Gruntjs
Processing
Youtube
Azure Service Fabric
Google Chrome Extension
Tensorflow
Google Chrome
Selenium Webdriver
Memory Management
Machine Learning
Sass
Twitter Bootstrap 3
Jquery Plugins
Resharper
Phpunit
Apache Nifi
Graphviz
Asp.net Mvc 3
Scripting
Ocaml
Mono
Discord.js
Msbuild
Omnet++
Mobile
Keyboard
Yii2
Enums
Xpath
Coq
Shopify
Floating Point
Sugarcrm
C#
Doctrine Orm
Aframe
Identityserver4
Azure Sql Database
Ssl
Polymer
Jwt
Git
Redux
Gradle
Awk
Drupal
Log4j
Ssh
Couchbase
Uitableview
Ruby On Rails 3
Active Directory
Windows Installer
Cloud Foundry
Kubernetes
Blackberry
Google Sheets
Amazon Redshift
Ipython
Swift
Tridion
Python 2.7
Install4j
Sharepoint
Fonts
Azure Active Directory
Firefox Addon
Jasmine
Download
Webstorm
Xamarin.ios
Sencha Touch
Mapreduce
Apache Flex
Composer Php
Ms Access
Cordova
Hbase
C++
Haskell
Sas
Autodesk Forge
Django
Azure Data Factory
Matplotlib
Linq To Sql
Stream
Big O
Rx Java
Filter
Assembly
Airflow
Less
Emacs
Binding
Spring Boot
Mqtt
Google Colaboratory
Apache Storm
Exception Handling
Bison
Phantomjs
Recursion
Com
Server
Sapui5
Testng
Autocomplete
Shiny
Passwords
Rspec
Ftp
Jupyter Notebook
Rally
Python
Editor
Elixir
Oracle Apex
Woocommerce
Zend Framework
Oracle10g
Hazelcast
Eclipse
Installation
Methods
Parameters
Jqgrid
Utf 8
Google Api
Multithreading
Sharepoint 2013
Docusignapi
Iphone
Ckeditor
Video
Google Bigquery
Cocoa
Image Processing
Tree
Solr
Jhipster
Sphinx
Deployment
Compiler Errors
Dependency Injection
Terraform
Lambda
Design Patterns
Maven
Zsh
Dictionary
Cassandra
Seo
Coldfusion
Email
Internet Explorer
Domain Driven Design
Notifications
Netbeans
Ios4
Visual Studio


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网