Regex 使用正则表达式消除地址中的换行符
我有一组地址数据,它有三个主要列:policy number、address和index number。在一些地址的中间有一些新线,我想去掉。但我不想去掉分隔每个数据行的新行。我正在使用textpad并尝试创建一个正则表达式,它可以通过搜索和替换来定位我要删除的特定换行符 每个索引号都是一个随机数,后跟“\u CDB”,因此我一直在尝试创建一个正则表达式,删除所有不带“\u CDB”的换行符。因此,我当前的表达式使用了一个类似于下面的Regex 使用正则表达式消除地址中的换行符,regex,textpad,Regex,Textpad,我有一组地址数据,它有三个主要列:policy number、address和index number。在一些地址的中间有一些新线,我想去掉。但我不想去掉分隔每个数据行的新行。我正在使用textpad并尝试创建一个正则表达式,它可以通过搜索和替换来定位我要删除的特定换行符 每个索引号都是一个随机数,后跟“\u CDB”,因此我一直在尝试创建一个正则表达式,删除所有不带“\u CDB”的换行符。因此,我当前的表达式使用了一个类似于下面的(?)的表达式,但它似乎仍在查找每一个新行,而不仅仅是那些不带
(?)的表达式,但它似乎仍在查找每一个新行,而不仅仅是那些不带“\u CDB”的新行“中国国家开发银行。”
如果有人能提出我错了的地方,或者建议在地址中间消除这些新线的另一种方法,那就太好了。
谢谢描述
您可能挂断了在行尾有空格的行。我只需匹配所有返回字符并捕获\u CDB\n
,然后替换
(_CDB\s*[\n\r]+)|[\n\r]
替换为:$1
例子
现场演示
示例文本
鹿公园路1111号321312
基诺沙
wi
531441111CDB
鹿公园路222号321312
基诺沙
wi
53144222_国家开发银行
鹿公园路333号321312
基诺沙
wi
53144333_国家开发银行
鹿公园路4444号321312
基诺沙
wi
53144、4444_国家开发银行
更换后
3213213121111迪尔公园路凯诺沙威53144,1111_川东北
基诺沙威鹿公园路222号321312,222_川东北53144
基诺沙威鹿公园路333号321312,333_川东北53144
CDB基诺沙威鹿公园路4444号321312、4444
解释
节点说明
----------------------------------------------------------------------
(组和捕获到\1:
----------------------------------------------------------------------
_国开行'\u国开行'
----------------------------------------------------------------------
\s*空格(\n、\r、\t、\f和“”)(0
或更多次(与最大金额匹配)
(可能的)
----------------------------------------------------------------------
[\n\r]+以下任意字符:'\n'(换行符),'\r'
(回车)(1次或多次
(匹配尽可能多的金额)
----------------------------------------------------------------------
)结束\1
----------------------------------------------------------------------
|或
----------------------------------------------------------------------
[\n\r]以下任意字符:'\n'(换行),'\r'
(回车)
----------------------------------------------------------------------
您能展示一下您的文件样本吗?