快速、支持Unicode的跨平台程序员';显示ZWSP等不可见对象的文本编辑器?

快速、支持Unicode的跨平台程序员';显示ZWSP等不可见对象的文本编辑器?,unicode,cross-platform,text-editor,large-files,invisible,Unicode,Cross Platform,Text Editor,Large Files,Invisible,我们的发布工作流包括Windows和Linux机器(也有一些Mac,但不在关键路径工作流中)。许多文本包括英语和高棉语,并用XML标记 XML复制编辑器是我发现的最好的跨平台开源XML编辑器。它使用闪烁编辑组件,该组件通常适用于Unicode,但不允许显示非打印或不可见字符,如U+200B(零宽度空间)和U+200C(零宽度非连接符)。高棉语不像西方语言那样用空格分隔单词,因此ZWSP被用于电子文本中,使应用程序能够轻松地断行 理想情况下,我会在一个编辑器中编辑标记和内容,但XML意识有时不如显

我们的发布工作流包括Windows和Linux机器(也有一些Mac,但不在关键路径工作流中)。许多文本包括英语和高棉语,并用XML标记

XML复制编辑器是我发现的最好的跨平台开源XML编辑器。它使用闪烁编辑组件,该组件通常适用于Unicode,但不允许显示非打印或不可见字符,如U+200B(零宽度空间)和U+200C(零宽度非连接符)。高棉语不像西方语言那样用空格分隔单词,因此ZWSP被用于电子文本中,使应用程序能够轻松地断行

理想情况下,我会在一个编辑器中编辑标记和内容,但XML意识有时不如显示不可见内容重要。(据我所知,OpenOffice.org Writer和Microsoft Word是仅有的两个显示ZWSP的应用程序。不幸的是,它们不适用于为出版准备手稿所需的标记和文本操作,尽管我认为它们适合创作。)

上周我试用了一个很有前途的编辑器,但在TextPad 4.7.3中,搜索并替换正则表达式的操作只花了不到一秒钟的时间,持续了二十多秒。因此,我想提及的是,处理大型(高达150mb)文件的速度和能力也是一个问题


是否有一个好的、快速的、免费的或不太昂贵的文本编辑器,它的版本在Windows和Linux上,可能也在mac上,支持Unicode,并且能够显示ZWSP之类的不可见文件?它具有语法突出显示功能,可以处理大型文件,并且可以自定义,因此我不会因沮丧而发疯。

我不知道ZWSP的具体情况,但它很好、快速、不昂贵,有一个非常好的正则表达式引擎,并且支持Unicode(也非常适合编辑XML)。开发人员(Jan Goyvaerts)居住在泰国,了解东方脚本和语言的要求,因此很有可能能够处理这些文本。

EditPad Pro(尚未)具备可视化ASCII空格和制表符以外的不可打印字符的能力。在执行单词换行和通过双击或Ctrl+Shift+Left/Right选择单词时,版本6将ZWSP识别为单词边界

您可以做的是搜索正则表达式
\u200B
。虽然这不会使零宽度空间可见,但它会选择它并将光标放在后面。您可以使用regex
\u200B\X
并打开搜索面板上的突出显示按钮,突出显示U+200B之后的每个图形。您甚至可以使用来编辑提供的XML方案,以使用regex始终在U+200B之后高亮显示每个grapheme

EditPad Pro可以轻松处理150 MB的文件,并具有强大的正则表达式引擎(与RegexBuddy和PowerGREP中使用的引擎相同)。最大文件大小为2 GB。仅限Windows。

我使用的是跨平台的,完全支持unicode


看一看

我会更仔细地看一看。泰语早于高棉语进入计算机时代,尽管泰语单词之间也没有空格,但Unicode时代之前的孕育意味着电子文本在单词之间没有任何标记。(取而代之的是,每个应用程序都使用自己的断线算法。)高棉人来晚了,这意味着每个人都希望自己的文本能够正确地显示在web上,因此对于这一额外的创作/制作要求几乎没有什么阻力。我希望它不仅知道ZWSP,而且能够显示它。谢谢Roger_SI尝试将0x200B插入到“普通”XML文档中,但我没有看到任何内容,但可能需要一种特殊的字体。如果它不起作用,请询问@Jan Goyvaerts(support@editpadpro)你自己。我相信他很快就会实现的。ZWSP是一个零宽度的空间。它应该是隐形的,不占空间。在(某些)语言中,它被用来划界单词之间没有空格的区域。要使其可见,需要EditPad在显示文本时替换另一个字符。