Python 从数据库中的特定格式提取数据
我有一个csv格式的原始数据,如下所示:Python 从数据库中的特定格式提取数据,python,pandas,dataframe,Python,Pandas,Dataframe,我有一个csv格式的原始数据,如下所示: df = { 'product-name': [ [""'Whole Wheat'""], [""'Milk'""] ], 'brand-name': [ [""'bb Royal'""], [""'XYZ'""] ], 'rating': [ [""'4.1'"
df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],
'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],
'rating': [
[""'4.1'""], [""'4.0'""] ]
}
df_p = pd.DataFrame(data=df)
产品名称品牌评级
[“全麦”][“bb皇家”][“4.1”]
预期产出:
产品名称品牌评级
全麦bb Royal 4.1
我希望这会影响数据集中的每个条目。我有10000行数据。我如何使用熊猫来实现这一点?
我们可以用正则表达式来实现吗?不知道怎么做
多谢各位
编辑1:
我的数据如下所示:
df = {
'product-name': [
[""'Whole Wheat'""], [""'Milk'""] ],
'brand-name': [
[""'bb Royal'""], [""'XYZ'""] ],
'rating': [
[""'4.1'""], [""'4.0'""] ]
}
df_p = pd.DataFrame(data=df)
它输出如下:[“bb Royal”]
PS:为我的编程道歉。我对编程和这个社区都很陌生。非常感谢您的帮助:)IIUC选择列表的第一个值:
df = df.apply(lambda x: x.str[0])
或者,如果值是字符串:
df = df.replace('[\[\]]', '', regex=True)
IIUC选择列表的第一个值:
df = df.apply(lambda x: x.str[0])
或者,如果值是字符串:
df = df.replace('[\[\]]', '', regex=True)
您可以使用explode函数
df = df.apply(pd.Series.explode)
您可以使用explode函数
df = df.apply(pd.Series.explode)
什么是打印(df.head()).to_dict())?您说的是csv,但看起来数据是由空格操作的?我可能只是对此感到困惑,我已经更新了这里的注释。什么是打印(df.head())。to_dict())?你说的是csv,但看起来数据是由空格分隔的?我可能对此感到困惑,我更新了这里的注释。它的输出是这样的:“Whole Wheat”我也需要删除双倒逗号。在我将正则表达式替换为“
”[“\[”\]]”后,它工作了。
它的输出是这样的:“Whole Wheat”我还需要删除双倒逗号。在我用'[“\[“\]]”替换正则表达式之后,它就起作用了。