Python 使用pandas在保持格式的同时覆盖excel列_Python_Pandas

Python 使用pandas在保持格式的同时覆盖excel列

python pandas

Python 使用pandas在保持格式的同时覆盖excel列,python,pandas,Python,Pandas,我正在处理一个xlsx文件，该文件如下所示：我以前的任务是修改名为“条目1”和“条目2”的列。我已经将这些列存储在原始数据帧的一个单独部分中，以便更好地进行概述。我将让您快速了解一下这一片的外观： >>> slice = df.loc[:, 'Entry 1':'Entry 2'] # code to modify the values >>> slice Entry 1 Entry 2 1 Modified 1 Value 1 2

我正在处理一个xlsx文件，该文件如下所示：

我以前的任务是修改名为“条目1”和“条目2”的列。我已经将这些列存储在原始数据帧的一个单独部分中，以便更好地进行概述。我将让您快速了解一下这一片的外观：

>>> slice = df.loc[:, 'Entry 1':'Entry 2']
# code to modify the values
>>> slice

    Entry 1     Entry 2
1   Modified 1  Value 1
2   Modified 2  Value 2
3   Modified 3  Value 3

现在我想用命名的切片覆盖原始数据帧中的那些列。我已经通过以下方法实现了这一点：

df.loc[:, 'Entry1':'Entry2'] = slice

from StyleFrame import StyleFrame

sf = StyleFrame.read_excel('test.xlsx', read_style=True)
# currently you have to specify each value manually,
# using slices will revert to the default style used by StyleFrame
sf.loc[0, 'Entry 1'].value = 'Modified 1'
sf.loc[1, 'Entry 1'].value = 'Modified 2'
sf.loc[2, 'Entry 1'].value = 'Modified 3'
sf.to_excel('test.xlsx').save()

# It is also possible to write the dataframe without the header and index.
df4.to_excel(writer, sheet_name='Sheet1',
             startrow=1, startcol=2, header=False, index=False)

问题

如您所见，列的标题具有特殊格式。如何覆盖“Entry1”和“Entry2”中的值，不包括标题，以保持格式？

完全公开：我是建议库的作者

不幸的是，

pandas

中没有现成的方法来实现这一点，因为它不加载样式数据。您可以使用（包装了

pandas

和

openpyxl

，我假设您已经安装了它们）来读取xlsx文件，同时保留（大多数）样式元素

在这种情况下使用它可能如下所示：

df.loc[:, 'Entry1':'Entry2'] = slice

from StyleFrame import StyleFrame

sf = StyleFrame.read_excel('test.xlsx', read_style=True)
# currently you have to specify each value manually,
# using slices will revert to the default style used by StyleFrame
sf.loc[0, 'Entry 1'].value = 'Modified 1'
sf.loc[1, 'Entry 1'].value = 'Modified 2'
sf.loc[2, 'Entry 1'].value = 'Modified 3'
sf.to_excel('test.xlsx').save()

# It is also possible to write the dataframe without the header and index.
df4.to_excel(writer, sheet_name='Sheet1',
             startrow=1, startcol=2, header=False, index=False)

使用循环的另一个备选方案：

sf = StyleFrame.read_excel('test.xlsx', read_style=True, use_openpyxl_styles=False)
new_values = ['Modified 1', 'Modified 2', 'Modified 3']
for cell, new_value in zip(sf['Entry 1'], new_values):
    cell.value = new_value
sf.to_excel('test.xlsx').save()

执行前的

test.xlsx

内容：

及之后：

完全披露：我是建议图书馆的作者