Regex 正则表达式问题:汉字和拼音的排序

Regex 正则表达式问题:汉字和拼音的排序,regex,libreoffice,Regex,Libreoffice,我正试着把汉字和拼音按正确的顺序分类。例如 得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。 => 得到 dédáo,取得 qǔdé,收到 什乌德奥,拿到 纳多,获得 胡德 为此,我使用Libreoffice,它接受正则表达式。问题是,我不知道如何编写合适的正则表达式 到目前为止,我已经创建了以下内容: ^([一-龥]+)[,] 这意味着1美元=得到 (这很好) 遗留问题: 1.如何识别其余的汉字组, i、 e.投入2美元=取得, $3=收到

我正试着把汉字和拼音按正确的顺序分类。例如

得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。
=> 得到 dédáo,取得 qǔdé,收到 什乌德奥,拿到 纳多,获得 胡德

为此,我使用Libreoffice,它接受正则表达式。问题是,我不知道如何编写合适的正则表达式

到目前为止,我已经创建了以下内容: ^([一-龥]+)[,] 这意味着1美元=得到 (这很好)

遗留问题: 1.如何识别其余的汉字组, i、 e.投入2美元=取得, $3=收到 等 汉字组的数量逐行变化

  • 如何分别识别拼音组,即。 把$a=dédéo$b=qǔdé等(或以其他一些不同于汉字组的方式)

  • 如何写入替换字符串以创建: 得到 dédáo,取得 qǔdé,收到 什乌德奥,拿到 纳多,获得 胡德

  • 问题的屏幕截图:


    由于您在问题评论中提到:

    “问题并不是特别与Libreoffice有关,而是如何形成适当的正则表达式”

    我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon()来解决这个问题:

    返回:

    text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
    hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
    pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
    comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']
    
    target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
    res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
    
    Process finished with exit code 0
    

    最后一行表示断言已通过,目标已达到。

    自从您在问题注释中提到:

    “问题并不是特别与Libreoffice有关,而是如何形成适当的正则表达式”

    我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon()来解决这个问题:

    返回:

    text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
    hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
    pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
    comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']
    
    target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
    res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
    
    Process finished with exit code 0
    

    最后一行表示断言已通过,目标已达到。

    好的,谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用?您知道,文本文件中有一些格式(斜体,粗体)。我不确定这些格式是否能在更改为纯文本文件后继续使用(我假设Python需要输入)?起初,我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然,我现在意识到,如果需要外部工具,那么屏幕截图也可能是必要的。这种材料有几千页,所以脚本是非常必要的。同样,复制粘贴到plai中也不太实际n没有格式的文本(这将无法实现自动化)。是的,您可以使用:好的,谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用?您知道,文本文件中有一些格式(斜体、粗体)。我不确定这些文件是否会在更改为纯文本文件后继续存在(我假设Python需要将其作为输入)?起初,我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然,我现在意识到,如果需要外部工具,那么屏幕截图也可能是必要的。这种材料有几千页,所以脚本是非常必要的。同样,复制粘贴到plai中也不太实际n没有格式化的文本(这将无法实现自动化)。是的,您可以使用:和