Warning: file_get_contents(/data/phpspider/zhask/data//catemap/5/sql/86.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
将MS Word文档章节提取到SQL数据库记录?_Sql_Ms Word - Fatal编程技术网

将MS Word文档章节提取到SQL数据库记录?

将MS Word文档章节提取到SQL数据库记录?,sql,ms-word,Sql,Ms Word,我有一个300多页的word文档,其中包含数百个“章节”(按标题格式定义),目前按word索引。每一章包含一个中等数量的文本(通常少于一页)和一个或两个相关的图形。我想将文档拆分为数据库记录,以便在iPhone程序中使用-每个章节都是一个由标题、id和内容字段组成的记录。我还没有决定是否希望图片是一个单独的字段(可能只是包含一个文件名),或者是内容文本中的HTML或类似样式的链接。在任何情况下,最终的结果都是我可以显示一个可搜索的标题表,用户可以点击它来调出任何给定的条目 目前我遇到的困难是从w

我有一个300多页的word文档,其中包含数百个“章节”(按标题格式定义),目前按word索引。每一章包含一个中等数量的文本(通常少于一页)和一个或两个相关的图形。我想将文档拆分为数据库记录,以便在iPhone程序中使用-每个章节都是一个由标题、id和内容字段组成的记录。我还没有决定是否希望图片是一个单独的字段(可能只是包含一个文件名),或者是内容文本中的HTML或类似样式的链接。在任何情况下,最终的结果都是我可以显示一个可搜索的标题表,用户可以点击它来调出任何给定的条目


目前我遇到的困难是从word文档到数据库。如何在保留图像关联的同时,最轻松地按章节将文档拆分为记录?我曾想过在每一章之间插入一些独特的字符,保存为文本格式,然后编写一个脚本,根据该字符将文档解析到数据库中,但我不确定我是否能够处理这种场景中的图形。其他选项?

回答我自己的问题:

给定一个格式相当简单的word文档

  • 将其转换为开放式Office XML文档

  • 编写python脚本,使用
    xml.sax
    python模块将文档解析到数据库中


  • 图像以HTML格式插入到记录中,并使用web界面显示。

    您可以接受自己的答案,这将帮助有相同问题的人。