Ms word Microsoft Word文档中的奇怪字符获胜';t出口/can';不可搜查

Ms word Microsoft Word文档中的奇怪字符获胜';t出口/can';不可搜查,ms-word,diacritics,fieldcodes,Ms Word,Diacritics,Fieldcodes,我有一份文件是草率写成的。这是一本包含西里尔字母的字典。这本词典的大部分内容是可以管理的,但有一件事我需要帮助。单词中有重音字母,它们的格式大多正确,是带有unicode重音的字母(因此形成一个字母)。然而,也有一些非常奇特的字母看起来很像,例如:a;')(其中“a”是任意的西里尔字母)。你会期望有人能取代它。然而,如果这个东西可以被导出到,比如说HTML,并在文本编辑器中操作,它本身就不会是一个问题。问题是Word将这个“东西”视为单个字符/实体,并且 导出时,它被完全忽略 复制时只能粘贴到

我有一份文件是草率写成的。这是一本包含西里尔字母的字典。这本词典的大部分内容是可以管理的,但有一件事我需要帮助。单词中有重音字母,它们的格式大多正确,是带有unicode重音的字母(因此形成一个字母)。然而,也有一些非常奇特的字母看起来很像,例如:a;')(其中“a”是任意的西里尔字母)。你会期望有人能取代它。然而,如果这个东西可以被导出到,比如说HTML,并在文本编辑器中操作,它本身就不会是一个问题。问题是Word将这个“东西”视为单个字符/实体,并且

  • 导出时,它被完全忽略
  • 复制时只能粘贴到记事本(将其翻译为三个单独的字符),粘贴到写字板时根本不会出现
  • 在Word中运行搜索时,将找不到字母、实际字符或精确复制/粘贴的组合
  • 当文档在任何其他软件(如Libre Office)中打开时,信件将消失
在这一点上,我试图:

  • 了解这个组合到底是什么
  • 运行搜索/替换操作以查找并清除所有这些错误
示例Word文件

下面是有关单词/字母的截图:


正确键入时,应显示为“
С楃楃楃楃П楃

“字符”似乎是“eq”(等式)类型的字字段。以下是带有切换字段代码的字段:


如果是一个大型文档,您可以尝试创建一个VBA例程,删除字段并用相应的字符替换它们。

假设@Anonimita的分析是正确的,正如我认为的那样,您可以通过在Word中运行一些搜索和替换操作来修复该文件,例如将^19eq\o(ö;')^21替换为(后一个字母是西里尔字母\,后跟锐重音U+0301)。这很枯燥,因为你需要分别对每个元音(以及大写元音)这样做。但我找不到在此上下文中使用通配符的方法;只有在未启用通配符的情况下,用于野外作业开始和结束的代码^19和^21。

Avast!声称问题中链接到的资源已被URL:Mal感染。这从任何意义上讲都不是编程问题,因此在这里是离题的。有关Word autom的问题在这里使用脚本或VBA脚本是合适的;一般来说使用Word是不合适的。有更多关于适合这里的问题类型的信息。投票关闭并迁移到更合适的地方。肯,从技术上讲不是,但我的最终目的是。我需要将文档分解成小部分并放入数据库中通过导出和运行regex搜索/替换查询。所以目的(至少)是编程。乔:好的。所以如果我问一个关于我应该买什么样的计算机的问题,这里的主题是有一天我是否打算用它来写代码?对不起-我不这么认为。:-)哇,谢谢!这样一个简单的解决方案,我错过了上下文菜单。更换这些不会是一个问题,现在我有暴露的符号。谢谢朱卡。搜索每一个单独的元音一点也不难!