Python 从数据库中的特定格式提取数据_Python_Pandas_Dataframe

Python 从数据库中的特定格式提取数据

python pandas dataframe

Python 从数据库中的特定格式提取数据,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个csv格式的原始数据，如下所示： df = { 'product-name': [ [""'Whole Wheat'""], [""'Milk'""] ], 'brand-name': [ [""'bb Royal'""], [""'XYZ'""] ], 'rating': [ [""'4.1'"

我有一个csv格式的原始数据，如下所示：

df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],

'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],

'rating': [
[""'4.1'""], [""'4.0'""] ]
 }
df_p = pd.DataFrame(data=df)

产品名称品牌评级

[“全麦”][“bb皇家”][“4.1”]

预期产出：

产品名称品牌评级

全麦bb Royal 4.1

我希望这会影响数据集中的每个条目。我有10000行数据。我如何使用熊猫来实现这一点？我们可以用正则表达式来实现吗？不知道怎么做

多谢各位

编辑1：我的数据如下所示：

df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],

'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],

'rating': [
[""'4.1'""], [""'4.0'""] ]
 }
df_p = pd.DataFrame(data=df)

它输出如下：[“bb Royal”]

PS：为我的编程道歉。我对编程和这个社区都很陌生。非常感谢您的帮助：）

IIUC选择列表的第一个值：

df = df.apply(lambda x: x.str[0])

或者，如果值是字符串：

df = df.replace('[\[\]]', '', regex=True)

IIUC选择列表的第一个值：

df = df.apply(lambda x: x.str[0])

或者，如果值是字符串：

df = df.replace('[\[\]]', '', regex=True)

您可以使用explode函数

df = df.apply(pd.Series.explode)

您可以使用explode函数

df = df.apply(pd.Series.explode)

什么是打印（df.head（））.to_dict（））？您说的是csv，但看起来数据是由空格操作的？我可能只是对此感到困惑，我已经更新了这里的注释。什么是打印（df.head（））。to_dict（））？你说的是csv，但看起来数据是由空格分隔的？我可能对此感到困惑，我更新了这里的注释。它的输出是这样的：“Whole Wheat”我也需要删除双倒逗号。在我将正则表达式替换为“

”[“\[”\]]”后，它工作了。

它的输出是这样的：“Whole Wheat”我还需要删除双倒逗号。在我用

'[“\[“\]]”替换正则表达式之后，它就起作用了。