Regex 如何修复OCR目录中数字居中的虚线?
ORC目录中有一些虚线,在Regex 如何修复OCR目录中数字居中的虚线?,regex,notepad++,ocr,Regex,Notepad++,Ocr,ORC目录中有一些虚线,在\t之后和\n之前可能有编号,也可能没有编号 输入: 9.1 The Euclidean Group in Two-Dimensional 152 Space E2 CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS, AND SPACE-TIME SYMMETRIES 173 如果一个数字夹在两个字母之间(示例中为152),则它是上一节的页码,应该删除。如果后面是另一个编号(下一节的编号),则
\t
之后和\n
之前可能有编号,也可能没有编号
输入:
9.1 The Euclidean Group in Two-Dimensional 152
Space E2
CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS,
AND SPACE-TIME SYMMETRIES 173
如果一个数字夹在两个字母之间(示例中为152
),则它是上一节的页码,应该删除。如果后面是另一个编号(下一节的编号),则它是正确的页码(173
此处),应予以保留。以下是所需的输出:
9.1 The Euclidean Group in Two-Dimensional Space E2
CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS, AND SPACE-TIME SYMMETRIES 173
我的尝试:
([a-zA-Z])(\t[0-9]*\n\t)((?![P])[A-Z])
但npp一直说它找不到文本,即使它在中运行良好。如何将其修复为正常状态?您可以使用
(\S)\t[0-9]*\R\t+
并替换为$1
(组1值占位符)
详细信息
-第1组:任何非空白字符(\S)
-一个选项卡\t
-0+位[0-9]*
-换行序列\R
-1个或多个选项卡(或\t+
-1+水平空白)\h+