Text AppleScript返回带有奇怪字符的文本

Text AppleScript返回带有奇怪字符的文本,text,applescript,character,Text,Applescript,Character,我有一个脚本来返回文本文件的一部分,但我注意到它有时返回直接查看文本文件时不可见的字符。例如,单词: breeders 变成 breed¬â rs 我尝试将“作为Unicode文本”添加到我的文本返回中,但不起作用。思想?这是我的剧本: set some_file to "[...]Words.txt" as alias set the_text to read some_file as string set the text item delimiters of AppleScript

我有一个脚本来返回文本文件的一部分,但我注意到它有时返回直接查看文本文件时不可见的字符。例如,单词:

breeders
变成

breed‰ rs
我尝试将“作为Unicode文本”添加到我的文本返回中,但不起作用。思想?这是我的剧本:

set some_file to "[...]Words.txt" as alias
set the_text to read some_file as string
set the text item delimiters of AppleScript to ", "
set the_lines to (every text item of the_text)
return some item of the_lines as Unicode text

您是否尝试过类似于ruby-KU-e的“繁育者”功能。chars{c | puts c.unpack(“U*”)[0]。to_s(16)}或搜索字符查看器中未正确显示的字符

read
将混淆非ASCII字符,除非将
添加为«class utf8»

do shell script "echo ä > /tmp/test.txt"
read POSIX file "/tmp/test.txt" as «class utf8»

作为文本
作为字符串
作为Unicode文本
是等价的。

您是否尝试过类似于
ruby-KU-e“breeders”的方法。chars{c |放置c.unpack(“U*”)[0]。到{s(16)}
或搜索字符查看器中未正确显示的字符

read
将混淆非ASCII字符,除非将
添加为«class utf8»

do shell script "echo ä > /tmp/test.txt"
read POSIX file "/tmp/test.txt" as «class utf8»

作为文本
作为字符串
,以及
作为Unicode文本
是等效的。

我可以使用PlainClip从剪贴板中剪切,“删除不可见的控制字符”,然后粘贴。但我希望不必经常这样做。不确定如何执行pbpaste或shell脚本。你能把你的代码放在上下文中吗?如果我将“as string”替换为“as«class utf8»”,则格式会改进为繁育,但仍然不完美。实际上,pbpaste也不能很好地处理非ASCII字符,因此我将其替换为Ruby命令。在任何情况下,原始文本文件都可能包含一些意外字符。能否将ruby命令放在我的AppleScript代码的上下文中?我根本不懂那种语言。谢谢很抱歉只需将其粘贴到终端即可运行。它打印字符的代码点;如果部分
80
或更大(非ASCII) 或者
1F
或更低版本(ASCII控制字符),您可以在字符查看器中搜索它们,以查看它们是什么字符。
设置一些文件来执行shell脚本“sed的//[^[:print:]//g'Words.txt”
。我可以使用PlainClip剪切,从剪贴板中删除不可见的控制字符,然后粘贴。但我希望不必经常这样做。不确定如何执行pbpaste或shell脚本。你能把你的代码放在上下文中吗?如果我将“as string”替换为“as«class utf8»”,则格式会改进为繁育,但仍然不完美。实际上,pbpaste也不能很好地处理非ASCII字符,因此我将其替换为Ruby命令。在任何情况下,原始文本文件都可能包含一些意外字符。能否将ruby命令放在我的AppleScript代码的上下文中?我根本不懂那种语言。谢谢很抱歉只需将其粘贴到终端即可运行。它打印字符的代码点;如果部分
80
或更大(非ASCII) 或者
1F
或更低版本(ASCII控制字符),您可以在字符查看器中搜索它们,以查看它们是什么字符。
设置一些文件来执行shell脚本“sed的//[^[:print:]//g'Words.txt”