Python str.contains基于另一列返回空字符串的值_Python_Pandas_Dataframe - Fatal编程技术网

Python str.contains基于另一列返回空字符串的值

python pandas dataframe

Python str.contains基于另一列返回空字符串的值,python,pandas,dataframe,Python,Pandas,Dataframe,我需要根据col2中的字符串填充数据帧中的col1，例如： Out[]: Col2 Col1 0 SAP SAP 1 Oracle Oracle 2 N/A 3 SAP SAP 4 SF Salesforce 代码可以工作，但是col1有不属于的值，因为col2是空的。（见第3行）尝试添加一个pd.np.where（df[column2]str.co

我需要根据col2中的字符串填充数据帧中的col1，例如：

Out[]: 
   Col2      Col1 
0  SAP       SAP     
1  Oracle    Oracle     
2            N/A     
3  SAP       SAP     
4  SF        Salesforce

代码可以工作，但是col1有不属于的值，因为col2是空的。（见第3行）

尝试添加一个

pd.np.where（df[column2]str.contains（“”，“Empty”）

但是，第1列的所有内容都用“Empty”填充，而忽略了其余部分

这是我的密码：

DF['Col1']= pd.np.where(DF['Col2'].str.contains('Oracle'), 'Oracle',
            pd.np.where(DF['Col2'].str.contains('SAP'), 'SAP',        
            pd.np.where(DF['Col2'].str.contains('SF'), 'Salesforce', 'N/A')))

预期产出为：

Out[]: 
   Col2      Col1 
0  SAP       SAP      
1  Oracle    Oracle     
2            N/A    
3  SAP       SAP      
4  SF        Salesforce

现在得到您展示的数据框架，我有了一个公平的想法，按照我的方式来做，不过可能会有更好的补充

原始数据帧，如注释部分所示：因此，您可以使用

Catagory

列上的

str.split（）

方法，通过空格分隔符将它们拆分，这将进一步创建四个新列，因为您正在从

Catagory

列中查找起始值，该列将位于必须选择的

列中

>>> df['Catagory'].str.split(' ', expand=True)
        0          1     2       3
0  Oracle        IPS  None    None
1     SAP        IPS  FICA  Module
2               None  None    None
3    SAAP        IPS    MM  Module
4      SF  Lightning  None    None

正如您在上面的列

中所看到的，仍然有一个空单元格，我们将使用

replace（）

方法，但是您将另一个值

SF

转换为

Salesforce

，因此也需要替换，因此，我将使用带有

replace

的dict方法一次性实现这两个目标

解决方案：因为，我们不需要从

split（）

生成的其他列，因此我删除了它们，并使用

assign（）

方法将值分配回新列

MGA\u new

，最终删除了不需要的原始列

MGA

如果要再次保留列名

MGA

，可以这样做

>>> df.rename(columns={'MGA_NEW':'MGA'}, inplace=True)
>>> df
              Catagory         MGA
0           Oracle IPS      Oracle
1  SAP IPS FICA Module         SAP
2                          Non-MGA
3   SAAP IPS MM Module        SAAP
4         SF Lightning  Salesforce

希望这会有帮助

现在获得您显示的数据帧，我有了按我的方式进行操作的合理想法，不过可能会有更好的补充

原始数据帧，如注释部分所示：因此，您可以使用

Catagory

列上的

str.split（）

方法，通过空格分隔符将它们拆分，这将进一步创建四个新列，因为您正在从

Catagory

列中查找起始值，该列将位于必须选择的

列中

>>> df['Catagory'].str.split(' ', expand=True)
        0          1     2       3
0  Oracle        IPS  None    None
1     SAP        IPS  FICA  Module
2               None  None    None
3    SAAP        IPS    MM  Module
4      SF  Lightning  None    None

正如您在上面的列

中所看到的，仍然有一个空单元格，我们将使用

replace（）

方法，但是您将另一个值

SF

转换为

Salesforce

，因此也需要替换，因此，我将使用带有

replace

的dict方法一次性实现这两个目标

解决方案：因为，我们不需要从

split（）

生成的其他列，因此我删除了它们，并使用

assign（）

方法将值分配回新列

MGA\u new

，最终删除了不需要的原始列

MGA

如果要再次保留列名

MGA

，可以这样做

>>> df.rename(columns={'MGA_NEW':'MGA'}, inplace=True)
>>> df
              Catagory         MGA
0           Oracle IPS      Oracle
1  SAP IPS FICA Module         SAP
2                          Non-MGA
3   SAAP IPS MM Module        SAAP
4         SF Lightning  Salesforce

希望这会有帮助

不要使用

str.contains（“”）

你可以考虑使用regex。以下代码使用正则表达式将整个数据帧中的所有空字符串替换为单词“

empty

”：

df.replace(r'^\s*$', 'Empty', regex=True, inplace=True)

不使用

str.contains（“”）

您可以考虑使用regex。以下代码使用正则表达式将整个数据帧中的所有空字符串替换为单词“

empty

”：

df.replace(r'^\s*$', 'Empty', regex=True, inplace=True)

包含（“”）

听起来很危险。它不是为任何字符串返回

True

吗？没有布尔返回，它用“空”字符串填充所有Col1。这就是我所说的，因为

df[column2].str.contains（“”

是所有

真的，np。其中将用空的填充所有内容是的，你是对的。我已经删除了那一行，但是空格被视为“Oracle”df.loc[df['Col2'].eq（“”，'Col2']='Empty'
？包含（“”）听起来很危险。它不是为任何字符串返回True
吗？没有布尔返回，它用“空”字符串填充所有Col1。这就是我所说的，因为df[column2].str.contains（“”
是所有真的，np。其中将用空的填充所有内容是的，你是对的。我已经删除了那一行，但是空格被视为“Oracle”df.loc[df['Col2'].eq（“”，'Col2']='Empty'
？不幸的是，我需要col1根据Col2中包含某些“关键字”的字符串使用不同的术语。你的代码可以工作，但并不完全符合我的需要，我很感激。NP，我理解。。你能显示实际的数据帧吗？我们可以匹配预期的输出吗？我需要在“Category”列中搜索匹配的字符串，并根据该字符串填充“MGA”列。这就是当前DF输出的样子：这就是我需要它的样子：我最终使用了您的解决方案的一部分，主要是字典思想，而没有分割数据。我克隆了category列，并使用.replace方法应用字典。感谢您很高兴它有帮助，甚至您可以将应用的解决方案放在pot中或作为答案。不幸的是，我需要col1根据col2中包含某些“关键字”的字符串使用不同的术语。你的代码可以工作，但并不完全符合我的需要，我很感激。NP，我理解。。你能显示实际的数据帧吗？我们可以匹配预期的输出吗？我需要在“Category”列中搜索匹配的字符串，并根据该字符串填充“MGA”列。这就是当前DF输出的样子：这就是我需要它的样子：我最终使用了您的解决方案的一部分，主要是字典思想，而没有分割数据。我克隆了category列，并使用.replace方法应用字典。谢谢你很高兴它有帮助，甚至你可以把你申请的解决方案放在壶上或作为答案。




[pandas]相关文章推荐



                                                        
Pandas 基于列值删除Python中的数据帧行
pandasipythondataframe 
Pandas 按百分比计算空值
pandas 
Pandas 以固定的时间间隔应用函数
pandasnumpy 
Pandas 为什么可以'；我是否删除默认的标签？
pandasmatplotlib 
在pandas中的groupBy之后打印多个列
pandas 
Pandas 熊猫数据帧上的自定义word2vec转换器并在FeatureUnion中使用
pandasscikit-learn 
Pandas 在Excel中使用Python中的StyleFrame库显示尾随零时出现问题
pandasformatting 
Pandas 如何在熊猫中按日期分组。I'；我在一个日期内有48个条目，即间隔30分钟
pandas 
Pandas 按列名查找
pandas 
Pandas 如何组合布尔掩码和切片对象来切片数据帧？
pandas 
Pandas 如何将numpy数组中的列附加到pd数据帧？
pandasnumpyscikit-learn 
Pandas 如果在列表中，请按索引选择多行
pandasindexing 
Pandas 如何将包含破折号（-）的两列相乘？
pandas 
Pandas 当文件名或路径包含中文字符时，pd.read\u hdf出错
pandas 
Pandas 数据帧未在循环中填充
pandasdataframefor-loop 
pandas-df.max（），多个最大值
pandasdataframe 
Pandas TI nspire python计算中的不同Q1和Q3值
pandasnumpy 
Pandas 提取行和数据的漂亮汤
pandas 
Pandas 熊猫：px.平行坐标，如何调整每个斧头的间隔？
pandas 
Pandas 根据数据框中最后一个单元格字符串对数据框列进行排序
pandas 
                                       





随机文章推荐



                                                        
Asp.net mvc 4 如何使用商业身份提供商（如ADFS2）
asp.net-mvc-4 
Asp.net mvc 4 ASP.NET MVC 4如何在控制器内管理用户ID和用户内容
asp.net-mvc-4 
Asp.net mvc 4 ModelContext+；"；查询「；一无所获
asp.net-mvc-4 
Asp.net mvc 4 从HttpContext.Current.User获取AD Guid
asp.net-mvc-4active-directory 
Asp.net mvc 4 我可以使用TextAreaFor助手作为html编辑器吗？
asp.net-mvc-4 
Asp.net mvc 4 为什么文件上传器不工作？
asp.net-mvc-4 
Asp.net mvc 4 编辑视图中多选列表框的超简单实现
asp.net-mvc-4 
Asp.net mvc 4 IE 11（或10）剑道ui文件上传将不会上传，除非我刷新页面（ctrl-F5）
asp.net-mvc-4kendo-ui 
Asp.net mvc 4 在控制器中获取Guid.Empty并将其传递给视图
asp.net-mvc-4 
Asp.net mvc 4 设置由@html.checkboxfor创建的隐藏输入类
asp.net-mvc-4razor 
Asp.net mvc 4 如何改变MVC Web网格结构？
asp.net-mvc-4razor 
Asp.net mvc 4 使用IIS时，信号器2.0错误/信号器/集线器404（未找到）
asp.net-mvc-4signalr 
Asp.net mvc 4 Azure缓存未跨VIP交换持久化会话状态？
asp.net-mvc-4cachingazure 
Asp.net mvc 4 模型数据未绑定到dropdownlist mvc 4
asp.net-mvc-4 
Asp.net mvc 4 MVC4：不明确的行动请求
asp.net-mvc-4 
Asp.net mvc 4 外部登录使用OAuthWebSecurity，内部登录使用SqlMembershipProvider
asp.net-mvc-4 
Asp.net mvc 4 剑道范围滑块在铬合金中断裂
asp.net-mvc-4kendo-ui 
Asp.net mvc 4 在MVC中使用多个下拉列表进行过滤
asp.net-mvc-4drop-down-menulinq-to-sql 
Asp.net mvc 4 如何在现有PDF中动态插入值？
asp.net-mvc-4pdf 
Asp.net mvc 4 未从OWIN调用Azure B2C登录策略自定义页面URI
asp.net-mvc-4azure-ad-b2c


                                        

                                        
                                        


                                                
                                                        [python]相关推荐
                                                        
Python 是否应该使用xrange（迭代次数）或len（迭代次数）列表来提高“a”中的性能；for loop"；100万次？
									Python
							 
Python 什么'；Dynamodb中的缓存有什么问题？
									Python
							 									Caching
							 									Network Programming
							 
Ziptwo dict包含Python中的列表
									Python
							 									Python 2.7
							 
如何使用特定规则比较Python中的两个数组元素级？
									Python
							 									Arrays
							 									Numpy
							 
Python是通过包含列表的字典列表创建新字典的最佳方法
									Python
							 									Arrays
							 									List
							 									Dictionary
							 									Ldap
							 
Python 如何从cgi脚本调用webbrowser？
									Python
							 									Linux
							 
Python 使用请求对象获取json响应
网络服务
网络服务器
错误
									Python
							 									Json
							 									Flask
							 
Python 将open（logPath，'；r'；）作为fh的语法错误：
									Python
							 
用python将字节写入文件
									Python
							 									Encoding
							 									Character Encoding
							 
Python 我的InstaRaider补丁上的Bug
									Python
							 									Python 2.7
							 									Selenium
							 									Selenium Webdriver
							 
Python 巴布亚新几内亚元'；t使用image.getbbox（）自动记录
									Python
							 									Image
							 
Python 如何将可转换为字符串的对象列表连接到字符串中？
									Python
							 
Python2.7中的数字列表
									Python
							 									Python 2.7
							 
Python 列出用于中断的帮助
									Python
							 									List
							 
Python MakeHuman没有运行OpenGL错误
									Python
							 									Python 2.7
							 									Python 3.x
							 									Opengl
							 
Python 数一数重复次数最多的一对熊猫
									Python
							 									Pandas
							 
Python 通过无线连接3个树莓pi
									Python
							 
Python 如何将一组数据帧中的列值替换为与另一组数据帧相比的列值
									Python
							 									Pandas
							 									Dataframe
							 
需要单个python正则表达式来实现以下功能：
									Python
							 									Regex
							 
Python 数组列表中元素的总和
									Python
							 									Arrays
							 									List
							 									Numpy
							 
Python 如何在另一个类中使用模块的方法
									Python
							 									Python 3.x
							 
Python 将np.数组（n，m）重塑为np.数组（m，n）
									Python
							 									Arrays
							 									Numpy
							 
如何在Darwin上测试Python代码（通过虚拟化）
									Python
							 
无法在Spyder上导入kivy

我正在使用Python 37、Kivy 1.11.1和Spyder3
我无法将kivy作为模块导入
我严格遵循这些说明，并按照建议为其设置了一个venv
Python脚本的文件保存在包含kivy的venv中
下面是运行的代码：import kivy
									Python
							 
在Python中加速正则表达式匹配
									Python
							 									Regex
							 
Python open不'；t根据文档创建文件
									Python
							 
Python，如何将2D数组堆叠为3D数组
									Python
							 									Arrays
							 
Python 如何固定滑块？它不是'；我不能按计划工作
									Python
							 									Matplotlib
							 
我可以帮助理解python SQL查询中的语法错误吗？
									Python
							 									Sql
							 
Python 用itertools和Leibniz级数逼近Pi值
									Python
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Sencha Touch 2
Memory Leaks
Path
Ios
Blockchain
Ios7
Here Api
Discord
C++ Cli
Shopify
Amp Html
Java
Hadoop
Clang
Embedded
Sparql
Replace
Data Binding
Hash
Sharepoint
Sms
Struct
Stata
Ssl
Numpy
Racket
Computer Vision
Hyperledger Fabric
Command Line
Time Complexity
Ios8
Tensorflow
Llvm
Powershell
Ms Access
Lotus Notes
Plone
X86
Flash
Openshift
Excel Formula
Content Management System
Mapping
Loopbackjs
Kotlin
Xamarin.forms
Symfony
Cocoa Touch
Caching
Cygwin
Log4net
Phpmyadmin
Typo3
Knockout.js
Tcp
Api
Linker
Sql Server 2005
Excel
Angularjs
Wcf
Android Fragments
Angular
Wix
Fullcalendar
Hive
Oop
Parsing
Jqgrid
Sequelize.js
Magento
Jquery
Ethereum
Cocoa
Asp.net Mvc 5
Extjs
Project Management
Wordpress
Merge
Cuda
Windows Phone
Opencart
Dojo
Html
Artificial Intelligence
Uml
Mapbox
Debian
Aws Lambda
Network Programming
Ruby On Rails 4
Junit
Ruby On Rails 3
Rdf
C++11
Google App Engine
Dask
Mule
Data Structures
Salesforce
Webgl
Jmeter
Jhipster
Mfc
Elixir
Jasper Reports
Io
Sails.js
Deployment
Prolog
Polymer
Filter
Firebase
Atom Editor
Codeigniter
Colors
Algorithm
Swiftui
Dictionary
C#
Javafx
Tkinter
Openlayers 3
Math
Reactjs
Ibm Mq
Build
Yii2
Botframework
Hybris
Speech Recognition
Arrays
Jira
Node.js
Json
Editor
Hyperlink
Objective C
Blackberry
Azure Functions
Django Rest Framework
Verilog
C# 3.0
Amazon Ec2
Tinymce
Serial Port
Oracle Apex
Git
Ios6
Jquery Ui
Google Compute Engine
Dialogflow Es
Sass
Centos
Seo
Gruntjs
Telerik
Process
Visual Studio 2017
Sql Server
Nlp
Devexpress
React Native
Ssh
Air
Windows Phone 7
Apache Flink
Jenkins
Flask
Tcl
Javascript
Safari
Osgi
Cucumber
Silverlight
Scripting
Calendar
Rabbitmq
Xampp
Pandas
Nservicebus
Url
Css
Google Sheets
Properties
Robotframework
Doctrine Orm
Virtualbox
Scikit Learn
EmptyTag
Ipad
Titanium
Cakephp
Apache
Methods
Ibm Midrange
Sphinx
Memory
Jdbc
Ruby On Rails 3.2
Spring Integration


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网