如何使用Unix/Linux命令计算韩语单词块?
韩语由词块组成(例如。,가, 나, 다 라, 等等)。我需要一个方法 数一数这些字块。例如,单词바다 (海)应该返回2。但是如何使用Unix/Linux命令计算韩语单词块?,linux,bash,unix,wc,Linux,Bash,Unix,Wc,韩语由词块组成(例如。,가, 나, 다 라, 等等)。我需要一个方法 数一数这些字块。例如,单词바다 (海)应该返回2。但是 wc-w将返回1 wc-c将返回7 所以这些选项对我不起作用。非常感谢您的帮助。바다长度为6字节。如果要计数字符,请使用wc-m: $ printf "바다" | wc -c 6 $ printf "바다" | wc -m 2 好的,所以从wc-m中减去wc-w应该可以计算块数。伟大的谢谢@김은기: 因为echo附加了一个换行符,所以它们都以
wc-w
将返回1
wc-c
将返回7
所以这些选项对我不起作用。非常感谢您的帮助。
바다编码为UTF-8的代码>长度为6字节。如果要计数字符,请使用wc-m
:
$ printf "바다" | wc -c
6
$ printf "바다" | wc -m
2
好的,所以从wc-m中减去wc-w应该可以计算块数。伟大的谢谢@김은기: 因为echo
附加了一个换行符,所以它们都以1为准,如果不清楚的话,很抱歉。查看我的更新。