Python 是否有任何正则表达式可以帮助在pandas中获取引号中的值?
我只想从引号中获取值。剩下的应该是NaN 我有这样的数据帧:Python 是否有任何正则表达式可以帮助在pandas中获取引号中的值?,python,regex,pandas,dataframe,Python,Regex,Pandas,Dataframe,我只想从引号中获取值。剩下的应该是NaN 我有这样的数据帧: Col A Col B Col C b'Ford' b'VW' b'' b'' b'VW' b'' b'' b'' b'BMW' B'Ford' b''
Col A Col B Col C
b'Ford' b'VW' b''
b'' b'VW' b''
b'' b'' b'BMW'
B'Ford' b'' b''
我想要这样的输出:
Col A Col B Col C
b'Ford' b'VW' b''
b'' b'VW' b''
b'' b'' b'BMW'
B'Ford' b'' b''
所需输出:
Col A Col B Col C
Ford VW NaN
NaN VW NaN
NaN NaN BMW
Ford NaN NaN
不知道为什么要将这些字符串作为字节。。。但一种方法是使用
字节对所有字节进行解码
df.applymap(bytes.decode)
Col A Col B Col C
0 Ford VW
1 VW
2 BMW
3 Ford
如果希望这些空字符串为NaN
:
df.applymap(bytes.decode).replace('', float('nan'))
Col A Col B Col C
0 Ford VW NaN
1 NaN VW NaN
2 NaN NaN BMW
3 Ford NaN NaN
只需检查如何在pandas中将字节转换为字符串。这回答了你的问题吗@耶斯雷尔,你能帮忙吗?我已经尝试了其他答案,但没有任何效果。TypeError:(“描述符“decode”需要一个“bytes”对象,但收到了一个“str”。