python docx获取单词位置和属性_Docx_Python Docx - Fatal编程技术网

python docx获取单词位置和属性

python docx获取单词位置和属性,docx,python-docx,Docx,Python Docx,我正在寻找一种方法来提取文档中每个单词的位置（x，y）和属性（字体/大小）从python docx文档中，我知道：从概念上讲，Word文档有两层：文本层和文本层绘图层。在文本层中，文本对象从左到右流动从右到下，在上一页开始时开始新页已经满了。在图形层中，图形对象（称为形状）是放置在任意位置。这些有时被称为浮动形状图片是可以出现在文本层或绘图层中的形状。当它出现在文本层中时，称为内联形状，或者更具体地说，一个内联图片 […]在撰写本文时，python docx仅支持内联图片然而

我正在寻找一种方法来提取文档中每个单词的位置（x，y）和属性（字体/大小）

从python docx文档中，我知道：

从概念上讲，Word文档有两层：文本层和文本层绘图层。在文本层中，文本对象从左到右流动从右到下，在上一页开始时开始新页已经满了。在图形层中，图形对象（称为形状）是放置在任意位置。这些有时被称为浮动形状

图片是可以出现在文本层或绘图层中的形状。当它出现在文本层中时，称为内联形状，或者更具体地说，一个内联图片

[…]在撰写本文时，python docx仅支持内联图片

然而，即使这不是它的要点，我想知道是否存在类似的情况：

from docx import Document
main_file = Document("/tmp/file.docx")
for paragraph in main_file.paragraphs:
    for word in paragraph.text:  # <= Non-existing (yet wished) functionnalities, IMHO
        print(word.x, word.y)  # <= Non-existing (yet wished) functionnalities, IMHO

来自docx导入文档
main\u file=Document（“/tmp/file.docx”）
对于主文件中的段落。段落：
对于段落中的单词。text:#

关于
print（word.x，word.y）#谢谢@scanny！这就是我害怕的。
for word in paragraph.text:  # <= Non-existing (yet wished) functionalities, IMHO    

for word in paragraph.text.split():
    ...

print(word.x, word.y)  # <= Non-existing (yet wished) functionnalities, IMHO




[marklogic]相关文章推荐



                                                        
Marklogic搜索查询
marklogic 
Marklogic中ModuleSpawn和ModuleInvoke之间的区别？
marklogic 
Marklogic 标记逻辑嵌入三元组中的推理
marklogic 
MarkLogic中的Taskserver线程
marklogic 
向slush marklogic示例添加一个方面
marklogic 
MarkLogic语义Sparql
marklogic 
Marklogic 使用林副本创建数据库
marklogic 
Marklogic 如何以json格式向StructuredQueryDefinition添加选项
marklogic 
Marklogic使用JavaAPI执行Xquery代码
marklogic 
MarkLogic SSL证书生成/使用
marklogic 
Marklogic 整数范围索引不适用于0值
marklogic 
Marklogic 计划任务是从哪个服务器触发的？
marklogic 
Marklogic 解释推理规则
marklogic 
MarkLogic—开发第三方备份和恢复解决方案
marklogic 
Marklogic op:and与多个op:where子句的比较
marklogic 
Marklogic 如何导入证书'；s通过ml gradle的公钥和私钥？
marklogic 
                                       





随机文章推荐



                                                        
如何使用相同的用户/密码创建多个joomla网站？
joomla 
Joomla的大型机
joomla 
使用用户配置文件表插件编写Joomla桥
joomla 
如何自定义joomla db sql错误消息以及如何防止重复条目
joomla 
Joomla Jupgrade安装错误
joomla 
Joomla Virtuemart中每种货币的统一价格
joomla 
Joomla：在组件中编写和调用助手函数
joomla 
URL中的Joomla 2.5语言代码。如何禁用？
joomla 
定制Joomla 1.6模板是否与Joomla 2.5兼容。？
joomla 
关于joomla 2.5中的菜单
joomla 
什么是组件joomla
joomla 
在Joomla 2.5上的Media Manager中管理图像
joomla 
Joomla 未显示侧边栏。如何解决这个问题？
joomla 
Joomla 使用全局访问而不是本地主机
joomla 
Joomla 约姆拉过期物品
joomla 
joomla用户选择模式（后端）不起作用，知道吗？
joomla 
Joomla文件系统路由
joomla 
Joomla 乔姆拉的桌子
joomla 
Joomla 利用站点带宽的自动机器人
joomla 
Joomla 在chronoforms中设置乘法器保存操作的表
joomla


                                        

                                        
                                        


                                                
                                                        [xampp]相关推荐
                                                        
mac osx lion xampp上的Pear位置
									Xampp
							 
未在XAMPP服务器中运行的php文件
									Xampp
							 
xampp中与php页面的数据库连接
									Xampp
							 
Xampp HTML&；PHP上传程序不'；行不通
									Xampp
							 									Php
							 									Html
							 									File Upload
							 
Xampp 另一个具有SSL的web服务器已在运行
									Xampp
							 									Debian
							 
Xampp 尝试phpmyadmin时出现空白页
									Xampp
							 
Xampp Phalcon DevTools:无法创建项目目录。Mkdir（）权限被拒绝
									Xampp
							 
Xampp 如何从应用程序中更改数据库源
									Xampp
							 
Xampp 皮姆科尔：为什么我能'；安装后看不到资产？
									Xampp
							 
Xampp 是否在Windows上使用特定路径创建文件/文件夹？
									Xampp
							 
                                                        
                                                

                                                
                                                        Tags
                                                        
Pascal
Prometheus
Post
Download
Kdb
Collections
Rx Java
Resharper
Cypress
Spring
Automation
Android
Amazon Web Services
Jvm
Amazon Dynamodb
Visual Studio
Bootstrap 4
Visual Studio Code
Sas
Azure Sql Database
Electron
Scala
Calendar
Discord
Generics
Asp.net Core
Racket
.net 4.0
Asp.net Core Mvc
Sml
Processing
Couchdb
Gdb
Clearcase
Unix
Qt
Cloud
Amp Html
Vim
Corda
Java Me
Isabelle
Object
Google Plus
3d
Plsql
Parameters
Qt4
Phantomjs
Spring Batch
Xmpp
Express
Synchronization
Variables
Forms
Graphviz
Silverlight 4.0
Apache
Kubernetes
Web
Acumatica
.net
Dotnetnuke
Animation
Telegram
Dependency Injection
Asp.net Mvc 2
Javafx
Combobox
Ibm Midrange
Office365
Ionic Framework
Windows Phone
Plone
Mpi
Uwp
Pytorch
Servlets
Maps
Web Applications
Api
D
Fullcalendar
Pyspark
Facebook
Amazon Redshift
Cobol
Ms Office
Dynamics Crm
Cakephp
Spring Mvc
Snmp
Asp Classic
Nginx
Xcode
Visual Studio 2017
Stored Procedures
E Commerce
Vb.net
Memory Leaks
Vector
Orientdb
Active Directory
Coffeescript
Struts2
Extjs4
Unit Testing
Firefox Addon
Exception
Css
Gtk
Stata
Three.js
Vaadin
Swift3
Android Emulator
Tridion
Triggers
Sugarcrm
C# 4.0
C++11
Autodesk Forge
Ssrs 2008
Geometry
Silverstripe
Excel
Yocto
Https
Ag Grid
Arangodb
Ios
Mvvm
Hybris
Merge
Ignite
Sql Server 2005
Plugins
Asynchronous
Woocommerce
Spring Integration
Opengl Es
Visual Studio 2010
Frameworks
Ldap
Dll
Ruby On Rails 3.1
Cygwin
Telerik
Exception Handling
Next.js
Latex
Phpunit
Ruby On Rails 3.2
Jersey
Nuget
Cocos2d Iphone
Identityserver4
Tableau Api
Rss
Mono
Itext
Stream
Logic
Sphinx
Algorithm
Encoding
Project Management
Layout
Elixir
View
Filter
Aem
Omnet++
.htaccess
Certificate
Zsh
Timer
EmptyTag
Grep
Ecmascript 6
Instagram
Lucene
Xslt
Playframework 2.0
Session
Swiftui
Meteor
Login
File Upload
Tsql
Ant
Apache Kafka
System Verilog
Interface
Vagrant
Spring Security
Bash
Cmake
Netbeans
Datetime
Verilog


                

                        
						
                        
                                
                                        
                                                
                                                        
                                                                Copyright © 2024. All Rights Reserved by  - Fatal编程技术网