如何删除excel单元格末尾python生成的特定字符?

如何删除excel单元格末尾python生成的特定字符?,python,pandas,Python,Pandas,当我运行脚本时,它会以我想要的方式生成excel格式,但每个单元格末尾的字符除外,如下所示: 剧本如下 import pandas as pd import win32com.client as win32 word = win32.Dispatch("Word.Application") word.Visible = 0 word.Documents.Open("file.docx") doc = word.ActiveDocument Entity = [] for i in (list

当我运行脚本时,它会以我想要的方式生成excel格式,但每个单元格末尾的字符除外,如下所示:

剧本如下

import pandas as pd
import win32com.client as win32
word = win32.Dispatch("Word.Application")
word.Visible = 0
word.Documents.Open("file.docx")
doc = word.ActiveDocument

Entity = []
for i in (list(range(3, 9)) + list(range(11,42))):
   table = doc.Tables(i)
   Entity.append(table.Cell(Row =2, Column =2).Range.Text)


combine_Table = {'Entity': Entity,}

labels = [list(range(1,38))]
df = pd.DataFrame(combine_Table , index=labels)                
df.to_excel("return.xlsx")

我可以在我的代码中添加一些东西来删除这个字符吗?

相信这在某种程度上解决了这个问题。它不是完美的,但有帮助。它将获取B列中的信息,清理它,然后将该信息放入AA列,删除多余的字符

wb = openpyxl.load_workbook('C:/Users/.../.xlsx')
sheet = wb.active

for row_num in range(1, 38):
    sheet['AA{}'.format(row_num)] = '=CLEAN(B{})'.format(row_num)

wb.save('C:/Users/.../.xlsx')

我会假设那个冒犯的角色是一条线的尽头。一种简单的方法是从Python代码中转储(一些)有问题的单元格的内容:
rawtext=str(df[index,col])
print(rawtext,[hex(ord(i))for i in rawtext)
@SergeBallesta它出现在每个单元格中,因此我无法删除内容。我想包括一个允许的字符列表(A-Z,0-9)为了删除任何不需要的字符,但我不知道如何才能做到这一点,我想在尝试应用修复程序之前确定会发生什么是很有趣的。这就是我之前评论的原因。