Python 熊猫：检查B列中包含的A列中的值_Python_Pandas - Fatal编程技术网

Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/333.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 熊猫：检查B列中包含的A列中的值_Python_Pandas - Fatal编程技术网

Python 熊猫：检查B列中包含的A列中的值

python pandas

Python 熊猫：检查B列中包含的A列中的值,python,pandas,Python,Pandas,我在df1中有100个关键字，在df2中有10000篇文章。我想计算有多少文章包含某个关键字。例如，大约有20篇文章包含关键词“apple” 我尝试使用df.str.contains（），但我必须计算每个关键字。你能告诉我一个有效的方法吗 df1=pd.DataFrame(['apple','mac','pc','ios','lg'],columns=['keywords']) df2=pd.DataFrame(['apple is good for health','mac is anot

我在df1中有100个关键字，在df2中有10000篇文章。我想计算有多少文章包含某个关键字。例如，大约有20篇文章包含关键词“apple”

我尝试使用df.str.contains（），但我必须计算每个关键字。你能告诉我一个有效的方法吗

df1=pd.DataFrame(['apple','mac','pc','ios','lg'],columns=['keywords'])


df2=pd.DataFrame(['apple is good for health','mac is another pc','today is sunday','Star wars pc game','ios is a system,lg is not','lg is a japan company '],columns=['article'])

结果:

1 artricl contain "apple"
1 article contain 'mac'
2 article contain 'pc'
1 article contain "ios"
2 article contain 'lg'

我认为需要使用带有

sum

的布尔级数来计算

True

s，这是类似

s的过程，对于所有

关键字使用列表理解
和数据帧构造函数：
L = [(x, df2['article'].str.contains(x).sum()) for x in df1['keywords']]
#alternative solution
#L = [(x, sum(x in article for article in df2['article'])) for x in df1['keywords']]
df3 = pd.DataFrame(L, columns=['keyword', 'count'])
print (df3)
  keyword  count
0   apple      1
1     mac      1
2      pc      2
3     ios      1
4      lg      2

如果只需要打印输出：
for x in df1['keywords']:
    count =  df2['article'].str.contains(x).sum()
    #another solution if no NaNs with sum, generator and check membership by in
    #count =  sum(x in article for article in df2['article'])
    print ('{} article contain "{}"'.format(count, x))

1 article contain "apple"
1 article contain "mac"
2 article contain "pc"
1 article contain "ios"
2 article contain "lg"

@安迪亚丹-不客气！如果我的答案有帮助，别忘了——点击答案旁边的复选标记，将其从灰色变为填充。谢谢




[pandas]相关文章推荐



                                                        
Pandas 如何从面板将系列分配给数据帧？
pandas 
Pandas 将每小时时间段转换为15分钟时间段
pandas 
pandas-在原始数据帧旁边显示应用的结果
pandas 
Pandas 在Windows 7上使用Pip安装熊猫
pandaswindowspip 
Pandas 基于数据类型对数据帧进行切片
pandasindexing 
Pandas 很难将数据帧的格式从字符串转换为浮点数
pandas 
Pandas 使用多索引更改数据帧中索引的顺序
pandasdataframe 
将不具有相同列的pandas数据帧列表合并到一个pandas数据帧
pandasmerge 
Pandas 如果数据帧合并，则会得到更多行
pandasdataframejoinmerge 
Pandas 熊猫系列萃取液，有规律的萃取
pandas 
Pandas 将值从多列传播到单列-复制
pandas 
Pandas 在列中查找连续非负数的块
pandas 
Pandas 熊猫为*组定义的*缺失日期*填充零
pandas 
Pandas 将数据帧与包含该数据帧的较大数据帧相交，并删除公用行
pandasdataframe 
Pandas 数据框在列中获取趋势
pandasdataframemachine-learning 
Pandas 在熊猫中重新排列多索引（多索引的第二级到单级列名的第二级）
pandas 
Pandas 当as_index=True时，通过添加额外的数字进行分组
pandas 
Pandas 过滤柱
pandas 
Pandas Python：透视表列排序
pandasdataframesorting 
Pandas 当使用df.to_csv写入csv时，熊猫数据帧整数列在csv文件中以科学符号表示
pandasdataframecsv 
                                       





随机文章推荐



                                                        
如果未安装包，如何使Ansible执行shell脚本
ansible 
是否有用于控制机器的Ansible远程客户端？
ansible 
如何在openstack实例上使用无ssh密钥的ansible？
ansibleopenstack 
Ansible 开发并调用另一个模块
ansible 
Ansible 调用另一个'；播放'；基于另一个播放列表的输出
ansible 
无法使用ansible unarchive模块创建目录路径？
ansible 
如何使用ansible生成单个可重复使用的随机密码
ansible 
Ansible 在两个远程主机之间同步文件/文件夹
ansible 
Ansible从文件中获取一个字符串，并在该输出中注册一个变量
ansible 
在Ansible任务中使用include_变量
ansible 
通过调试打印Ansible子变量
ansible 
Ansible：如何删除&；从VCenter注册虚拟机？
ansiblevmware 
有没有办法在Ansible中显示已注册的处理程序或侦听器？
ansible 
ansible playbook是否可以按节点运行？
ansible 
如何使用Ansible将多个过滤器拆分为多行？
ansible 
&引用；apt"；Ansible playbook中的模块每次在不同主机上执行时都会随机失败，并显示消息“0”；未能为独占操作锁定apt“；
ansible 
如果启用了ufw，如何运行ansible任务？
ansible 
检查其中一个文件是否存在于ansible中
ansibleyaml 
如何使用串行连接的ansible而不是ssh
ansibleserial-port 
Ansible 如果需要修改或修改任何内容，请使用更改检测更改WebSphere for HCL连接中的MailSession
ansiblewebsphere


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
                                                        
                                                

                                                
                                                        Tags
                                                        
Gulp
Twitter Bootstrap 3
Extjs
Oracle Apex
Continuous Integration
Google Chrome
Bash
Google Plus
Cloud Foundry
Ssrs 2008
Orm
Jquery Mobile
Spring Batch
Sails.js
E Commerce
Authentication
Safari
System Verilog
Serial Port
Vbscript
Bazel
Xaml
Doctrine Orm
Ipython
Navigation
Azure Service Fabric
Yii2
Ruby On Rails
Map
Laravel
Collections
Dialogflow Es
User Interface
Embedded
Svg
Pandas
Linker
F#
Eclipse Rcp
Asp.net
Discord
Twilio
Signalr
Drupal 7
Ruby On Rails 4
Sencha Touch
Rx Java
Recursion
Gdb
Sugarcrm
Datetime
Hibernate
Character Encoding
Udp
Iphone
Data Structures
Openlayers
Xamarin
Seo
Salesforce
Asp.net Core
Nativescript
Ansible
Deployment
Php
Couchbase
Polymer
Lisp
Influxdb
Composer Php
Elm
Dynamics Crm
Oauth
Big O
Odoo
Unix
Windows Phone 8
Concurrency
Solr
Computer Science
Jdbc
Llvm
Replace
Mongoose
Ffmpeg
Cygwin
Proxy
Interface
Java 8
Smalltalk
Apache Nifi
Gps
Makefile
Mfc
Google Maps
Office365
Tinymce
Visual C++
Aws Lambda
Android Emulator
Ios8
Camera
Java Me
Websocket
Transactions
Primefaces
Nginx
Notifications
EmptyTag
Command Line
Mule
Filter
Paypal
Marklogic
Sapui5
Xquery
Security
Open Source
Hive
Dynamics Crm 2011
File Io
Kendo Ui
Resharper
Actionscript
Memory
Build
Openerp
Angular6
Ssh
Identityserver4
Umbraco
Vb.net
Bison
Ios6
Doctrine
Input
Webview
Virtualbox
Azure Sql Database
Generics
Jsp
Sparql
Cocos2d Iphone
Twitter
Django Models
Multithreading
Zsh
Iis 7
Symfony
Gwt
Spring
D3.js
Http
Rest
Ssl
Jhipster
Chef Infra
Jersey
Plugins
Random
Teamcity
Pycharm
Subsonic
Imagemagick
Google Analytics
Meteor
Firefox
Speech Recognition
Notepad++
Apache Kafka
Pagination
C# 3.0
Eclipse Plugin
Install4j
Computer Vision
Jaxb
Vmware
Domain Driven Design
Binding
Loops
View
.net Core
File Upload
Sed
Microsoft Graph Api
Omnet++
Swift3
Matplotlib
Office Js
Snmp
Encryption
Plot
Apache Camel
Iframe
Less
Path
Ipad
Variables
Prometheus
Silverstripe
Spring Security


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网