Regex 正则表达式问题:汉字和拼音的排序
我正试着把汉字和拼音按正确的顺序分类。例如 得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。Regex 正则表达式问题:汉字和拼音的排序,regex,libreoffice,Regex,Libreoffice,我正试着把汉字和拼音按正确的顺序分类。例如 得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。 => 得到 dédáo,取得 qǔdé,收到 什乌德奥,拿到 纳多,获得 胡德 为此,我使用Libreoffice,它接受正则表达式。问题是,我不知道如何编写合适的正则表达式 到目前为止,我已经创建了以下内容: ^([一-龥]+)[,] 这意味着1美元=得到 (这很好) 遗留问题: 1.如何识别其余的汉字组, i、 e.投入2美元=取得, $3=收到
=> 得到 dédáo,取得 qǔdé,收到 什乌德奥,拿到 纳多,获得 胡德 为此,我使用Libreoffice,它接受正则表达式。问题是,我不知道如何编写合适的正则表达式 到目前为止,我已经创建了以下内容: ^([一-龥]+)[,] 这意味着1美元=得到 (这很好) 遗留问题: 1.如何识别其余的汉字组, i、 e.投入2美元=取得, $3=收到 等 汉字组的数量逐行变化
由于您在问题评论中提到: “问题并不是特别与Libreoffice有关,而是如何形成适当的正则表达式” 我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon()来解决这个问题: 返回:
text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']
target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
Process finished with exit code 0
最后一行表示断言已通过,目标已达到。自从您在问题注释中提到: “问题并不是特别与Libreoffice有关,而是如何形成适当的正则表达式” 我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon()来解决这个问题: 返回:
text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']
target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
Process finished with exit code 0
最后一行表示断言已通过,目标已达到。好的,谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用?您知道,文本文件中有一些格式(斜体,粗体)。我不确定这些格式是否能在更改为纯文本文件后继续使用(我假设Python需要输入)?起初,我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然,我现在意识到,如果需要外部工具,那么屏幕截图也可能是必要的。这种材料有几千页,所以脚本是非常必要的。同样,复制粘贴到plai中也不太实际n没有格式的文本(这将无法实现自动化)。是的,您可以使用:好的,谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用?您知道,文本文件中有一些格式(斜体、粗体)。我不确定这些文件是否会在更改为纯文本文件后继续存在(我假设Python需要将其作为输入)?起初,我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然,我现在意识到,如果需要外部工具,那么屏幕截图也可能是必要的。这种材料有几千页,所以脚本是非常必要的。同样,复制粘贴到plai中也不太实际n没有格式化的文本(这将无法实现自动化)。是的,您可以使用:和