Regex 正则表达式问题：汉字和拼音的排序_Regex_Libreoffice

Regex 正则表达式问题：汉字和拼音的排序

regex

Regex 正则表达式问题：汉字和拼音的排序,regex,libreoffice,Regex,Libreoffice,我正试着把汉字和拼音按正确的顺序分类。例如得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。 => 得到 dédáo，取得 qǔdé，收到什乌德奥，拿到纳多，获得胡德为此，我使用Libreoffice，它接受正则表达式。问题是，我不知道如何编写合适的正则表达式到目前为止，我已经创建了以下内容： ^([一-龥]+)[,] 这意味着1美元=得到（这很好）遗留问题： 1.如何识别其余的汉字组， i、 e.投入2美元=取得, $3=收到

我正试着把汉字和拼音按正确的顺序分类。例如

得到, 取得, 收到, 拿到, 获得 dédéo、qǔdé、Shudéo、nádéo、huòdé。
=> 得到 dédáo，取得 qǔdé，收到什乌德奥，拿到纳多，获得胡德

为此，我使用Libreoffice，它接受正则表达式。问题是，我不知道如何编写合适的正则表达式

到目前为止，我已经创建了以下内容： ^([一-龥]+)[,] 这意味着1美元=得到（这很好）

遗留问题： 1.如何识别其余的汉字组， i、 e.投入2美元=取得, $3=收到等汉字组的数量逐行变化

如何分别识别拼音组，即。把$a=dédéo$b=qǔdé等（或以其他一些不同于汉字组的方式）

如何写入替换字符串以创建：得到 dédáo，取得 qǔdé，收到什乌德奥，拿到纳多，获得胡德

问题的屏幕截图：

由于您在问题评论中提到：

“问题并不是特别与Libreoffice有关，而是如何形成适当的正则表达式”

我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon（）来解决这个问题：

text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']

target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'

Process finished with exit code 0

最后一行表示断言已通过，目标已达到。

自从您在问题注释中提到：

“问题并不是特别与Libreoffice有关，而是如何形成适当的正则表达式”

我选择使用Python来解决这个问题。Python可以使用正则表达式和zhon（）来解决这个问题：

text = '得到, 取得, 收到, 拿到, 获得 dédào, qǔdé, shōudào, nádào, huòdé.'
hanzi_char = ['得', '到', '取', '得', '收', '到', '拿', '到', '获', '得']
pinyin_word = ['dédào', 'qǔdé', 'shōudào', 'nádào', 'huòdé']
comb_hanzi_char = ['得到', '取得', '收到', '拿到', '获得']

target = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'
res = '得到 dédào, 取得 qǔdé, 收到 shōudào, 拿到 nádào, 获得 huòdé.'

Process finished with exit code 0

最后一行表示断言已通过，目标已达到。

好的，谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用？您知道，文本文件中有一些格式（斜体，粗体）。我不确定这些格式是否能在更改为纯文本文件后继续使用（我假设Python需要输入）？起初，我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然，我现在意识到，如果需要外部工具，那么屏幕截图也可能是必要的。这种材料有几千页，所以脚本是非常必要的。同样，复制粘贴到plai中也不太实际n没有格式的文本（这将无法实现自动化）。是的，您可以使用：好的，谢谢您的解决方案。是否可以将Python+zhon与Libreofice Writer一起使用？您知道，文本文件中有一些格式（斜体、粗体）。我不确定这些文件是否会在更改为纯文本文件后继续存在（我假设Python需要将其作为输入）？起初，我认为只要一个合适的正则表达式脚本就可以解决这个问题。当然，我现在意识到，如果需要外部工具，那么屏幕截图也可能是必要的。这种材料有几千页，所以脚本是非常必要的。同样，复制粘贴到plai中也不太实际n没有格式化的文本（这将无法实现自动化）。是的，您可以使用：和