Python 数据帧隔离性

Python 数据帧隔离性,python,pandas,dataframe,Python,Pandas,Dataframe,在数据帧中,如: x | y ---------- aa(df) | df cc | ee(ps) | ps 陈述错误 df['y'].str.match(df['y'].str.match(r".+")) 我想验证“y”列的每个元素是否都包含在“x”中的字符串中。df的等级相当一致:10^5 谢谢我推荐 df.apply(λc:c[“y”]在c[“x”]中,轴=1) 参见熊猫测试: >>将熊猫作为pd导入 >>>df=pd.DataFrame(

在数据帧中,如:

 x     |    y
----------
aa(df) | df
cc     |
ee(ps) | ps
陈述错误

df['y'].str.match(df['y'].str.match(r".+"))
我想验证“y”列的每个元素是否都包含在“x”中的字符串中。df的等级相当一致:10^5

谢谢

我推荐

df.apply(λc:c[“y”]在c[“x”]中,轴=1)
参见熊猫测试:

>>将熊猫作为pd导入
>>>df=pd.DataFrame({'x':['aa(df)'cc','ee(ps)','y':['df','','ps']})
>>>df.apply(λc:c[“y”]在c[“x”]中,轴=1)
0对
1正确
2正确
数据类型:bool
注释

  • .apply
    将迭代所有行(按行),因为
    设置为
    1
  • 每次检查列
    y
    是否包含列
    x
    中的值时

谢谢。但是仍然让我困惑:df.apply应该返回0真1假2真,因为整个y[0]匹配x[0]…我的意思是y[0]和y3,x3都是x[0]的子字符串。反转y2和x2不!我仍然对函数感到困惑,因为我正在将我的思想从perl转换为python..@solocazzimiei您的意思是第二个值为false,因为值为空?在Perl术语中,c[“x”]中的
c[“y”]是
if(索引(c[“y”],c[“x”])!=-1)
。如果
x
是一个空字符串,那么它肯定是任何字符串的子集。x2,y2为false,因为在perl中x2=~/y2/为false;对于x1和x3是正确的。。这就是我想要匹配的,Wik@solocazzimiei但是
y2
是空的,在Perl中,如果regex模式是空的,
/
。它不一定是假的。因此,您需要精确:是否希望第二行有
False
,因为
y
(模式)为空?@solocazzimiei Try
df.apply(λc:c[“y”]在c[“x”]中,如果c[“y”]为False,则轴=1)
。你现在得到预期的结果了吗?