将MS Word文档章节提取到SQL数据库记录?
我有一个300多页的word文档,其中包含数百个“章节”(按标题格式定义),目前按word索引。每一章包含一个中等数量的文本(通常少于一页)和一个或两个相关的图形。我想将文档拆分为数据库记录,以便在iPhone程序中使用-每个章节都是一个由标题、id和内容字段组成的记录。我还没有决定是否希望图片是一个单独的字段(可能只是包含一个文件名),或者是内容文本中的HTML或类似样式的链接。在任何情况下,最终的结果都是我可以显示一个可搜索的标题表,用户可以点击它来调出任何给定的条目将MS Word文档章节提取到SQL数据库记录?,sql,ms-word,Sql,Ms Word,我有一个300多页的word文档,其中包含数百个“章节”(按标题格式定义),目前按word索引。每一章包含一个中等数量的文本(通常少于一页)和一个或两个相关的图形。我想将文档拆分为数据库记录,以便在iPhone程序中使用-每个章节都是一个由标题、id和内容字段组成的记录。我还没有决定是否希望图片是一个单独的字段(可能只是包含一个文件名),或者是内容文本中的HTML或类似样式的链接。在任何情况下,最终的结果都是我可以显示一个可搜索的标题表,用户可以点击它来调出任何给定的条目 目前我遇到的困难是从w
目前我遇到的困难是从word文档到数据库。如何在保留图像关联的同时,最轻松地按章节将文档拆分为记录?我曾想过在每一章之间插入一些独特的字符,保存为文本格式,然后编写一个脚本,根据该字符将文档解析到数据库中,但我不确定我是否能够处理这种场景中的图形。其他选项?回答我自己的问题: 给定一个格式相当简单的word文档
xml.sax
python模块将文档解析到数据库中图像以HTML格式插入到记录中,并使用web界面显示。您可以接受自己的答案,这将帮助有相同问题的人。