如何使用python从docx读取json文件
我有一个docx文件,如下所示如何使用python从docx读取json文件,python,json,list,dictionary,docx,Python,Json,List,Dictionary,Docx,我有一个docx文件,如下所示 [ { "name": "ravi", "city": "chennai", "country": "india" } { "name": "raj", "city": "chennai", "country": "india" } ] 我试着把这些内容作为一系列字典来阅读。我试过这个 from docx import Document document = Document('2255858_1
[ { "name": "ravi",
"city": "chennai",
"country": "india"
}
{
"name": "raj",
"city": "chennai",
"country": "india"
}
]
我试着把这些内容作为一系列字典来阅读。我试过这个
from docx import Document
document = Document('2255858_1321163255_worldcupdata.docx')
s=""
for i in document.paragraphs:
s+=i.text
json_list=s[1:-1].split('}')
但我无法将字符串转换为dict,下面语句的值出现错误
dict('{ "name": "ravi", "city": "chennai", "country": "india" }')
ValueError:字典更新序列元素#0的长度为1;2是必需的
您可以使用json
[编辑]
from docx import Document
import regex as re
import json
document = Document('2255858_1321163255_worldcupdata.docx')
s=""
for i in document.paragraphs:
s+=i.text
p = re.compile('\[(.*?)\]')
d = json.loads(p.search(s).group(0))
Dod=json.load(你的字符串)
d将是你的口述
loads
从json将字符串转换为dict我尝试了一个JSONDecodeError:期望值:第1行第1列(char 0)
打印提取的字符串时,会得到什么?因为那里一定有一些问题,这应该会起作用。print(s)给出了'[{“name”:“ravi”,“city”:“chennai”,“country”:“india”},{…
是否以]
和}
结束,因为当输入字符串的格式不正确时会出现错误?您将如何分割数据进行迭代,如果按“}”拆分,则将从字符串中删除该值