Regex 如何修复OCR目录中数字居中的虚线?

Regex 如何修复OCR目录中数字居中的虚线?,regex,notepad++,ocr,Regex,Notepad++,Ocr,ORC目录中有一些虚线,在\t之后和\n之前可能有编号,也可能没有编号 输入: 9.1 The Euclidean Group in Two-Dimensional 152 Space E2 CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS, AND SPACE-TIME SYMMETRIES 173 如果一个数字夹在两个字母之间(示例中为152),则它是上一节的页码,应该删除。如果后面是另一个编号(下一节的编号),则

ORC目录中有一些虚线,在
\t
之后和
\n
之前可能有编号,也可能没有编号

输入:

    9.1 The Euclidean Group in Two-Dimensional  152
    Space E2
CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS,    
    AND SPACE-TIME SYMMETRIES   173
如果一个数字夹在两个字母之间(示例中为
152
),则它是上一节的页码,应该删除。如果后面是另一个编号(下一节的编号),则它是正确的页码(
173
此处),应予以保留。以下是所需的输出:

    9.1 The Euclidean Group in Two-Dimensional Space E2
CHAPTER 10: THE LORENTZ AND POINCARÉ GROUPS, AND SPACE-TIME SYMMETRIES  173
我的尝试:

([a-zA-Z])(\t[0-9]*\n\t)((?![P])[A-Z])
但npp一直说它找不到文本,即使它在中运行良好。如何将其修复为正常状态?

您可以使用

(\S)\t[0-9]*\R\t+
并替换为
$1
(组1值占位符)

详细信息

  • (\S)
    -第1组:任何非空白字符
  • \t
    -一个选项卡
  • [0-9]*
    -0+位
  • \R
    -换行序列
  • \t+
    -1个或多个选项卡(或
    \h+
    -1+水平空白)