Dictionary 日语卡卡西字典有一些奇怪的字母
我从以下网站下载了kakasi的源程序包: 然后我解压缩了它:Dictionary 日语卡卡西字典有一些奇怪的字母,dictionary,letters,Dictionary,Letters,我从以下网站下载了kakasi的源程序包: 然后我解压缩了它: plee@sos:~/Japanese/kakasi$ tar zxvf kakasi_2.3.5~pre1+cvs20071101.orig.tar.gz kakasi-2.3.5pre1/ kakasi-2.3.5pre1/maintMakefile kakasi-2.3.5pre1/INSTALL-ja kakasi-2.3.5pre1/ONEWS kakasi-2.3.5pre1/kakasi.spec.in kakasi
plee@sos:~/Japanese/kakasi$ tar zxvf kakasi_2.3.5~pre1+cvs20071101.orig.tar.gz
kakasi-2.3.5pre1/
kakasi-2.3.5pre1/maintMakefile
kakasi-2.3.5pre1/INSTALL-ja
kakasi-2.3.5pre1/ONEWS
kakasi-2.3.5pre1/kakasi.spec.in
kakasi-2.3.5pre1/src/
kakasi-2.3.5pre1/src/a2.c
kakasi-2.3.5pre1/src/k2.c
kakasi-2.3.5pre1/src/jj2.c
kakasi-2.3.5pre1/src/itaiji.c
kakasi-2.3.5pre1/src/getopt1.c
kakasi-2.3.5pre1/src/getopt.h
kakasi-2.3.5pre1/src/dict.c
kakasi-2.3.5pre1/src/kakasi.c
kakasi-2.3.5pre1/src/kk2.c
kakasi-2.3.5pre1/src/mkkanwa.c
kakasi-2.3.5pre1/src/atoc-conv.c
kakasi-2.3.5pre1/src/conv-util.h
kakasi-2.3.5pre1/src/78_83.c
kakasi-2.3.5pre1/src/conv-util.c
kakasi-2.3.5pre1/src/level.h
kakasi-2.3.5pre1/src/rdic-conv.c
kakasi-2.3.5pre1/src/ee2.c
kakasi-2.3.5pre1/src/Makefile.am
kakasi-2.3.5pre1/src/Makefile.in
kakasi-2.3.5pre1/src/g2.c
kakasi-2.3.5pre1/src/j2.c
kakasi-2.3.5pre1/src/hh2.c
kakasi-2.3.5pre1/src/kakasi.h
kakasi-2.3.5pre1/src/wx2-conv.c
kakasi-2.3.5pre1/src/level.c
kakasi-2.3.5pre1/src/kanjiio.c
kakasi-2.3.5pre1/src/getopt.c
kakasi-2.3.5pre1/config.guess
kakasi-2.3.5pre1/config.rpath
kakasi-2.3.5pre1/INSTALL
kakasi-2.3.5pre1/configure.in
kakasi-2.3.5pre1/AUTHORS
kakasi-2.3.5pre1/config.sub
kakasi-2.3.5pre1/NEWS
kakasi-2.3.5pre1/configure
kakasi-2.3.5pre1/tests/
kakasi-2.3.5pre1/tests/kakasi-6
kakasi-2.3.5pre1/tests/kakasi-5
kakasi-2.3.5pre1/tests/env.sh
kakasi-2.3.5pre1/tests/kakasi-2
kakasi-2.3.5pre1/tests/kakasi-1
kakasi-2.3.5pre1/tests/kakasi-7
kakasi-2.3.5pre1/tests/kakasi-4
kakasi-2.3.5pre1/tests/Makefile.am
kakasi-2.3.5pre1/tests/Makefile.in
kakasi-2.3.5pre1/tests/kakasi-3
kakasi-2.3.5pre1/ltmain.sh
kakasi-2.3.5pre1/THANKS
kakasi-2.3.5pre1/man/
kakasi-2.3.5pre1/man/kakasi.1.ja
kakasi-2.3.5pre1/man/kakasi.cat
kakasi-2.3.5pre1/man/kakasi.1
kakasi-2.3.5pre1/man/kakasi.cat.ja
kakasi-2.3.5pre1/man/Makefile.am
kakasi-2.3.5pre1/man/Makefile.in
kakasi-2.3.5pre1/aclocal.m4
kakasi-2.3.5pre1/kakasi-config.in
kakasi-2.3.5pre1/kakasi.spec
kakasi-2.3.5pre1/install-sh
kakasi-2.3.5pre1/missing
kakasi-2.3.5pre1/COPYING
kakasi-2.3.5pre1/README
kakasi-2.3.5pre1/kakasidict
kakasi-2.3.5pre1/README-ja
kakasi-2.3.5pre1/doc/
kakasi-2.3.5pre1/doc/README.BeOS
kakasi-2.3.5pre1/doc/README.lib
kakasi-2.3.5pre1/doc/JISYO
kakasi-2.3.5pre1/doc/CVS/
kakasi-2.3.5pre1/doc/CVS/Repository
kakasi-2.3.5pre1/doc/CVS/Entries
kakasi-2.3.5pre1/doc/CVS/Root
kakasi-2.3.5pre1/doc/README.wakati
kakasi-2.3.5pre1/doc/README.level
kakasi-2.3.5pre1/doc/ChangeLog.lib
kakasi-2.3.5pre1/doc/README.OS2
kakasi-2.3.5pre1/itaijidict
kakasi-2.3.5pre1/Makefile.am
kakasi-2.3.5pre1/TODO
kakasi-2.3.5pre1/lib/
kakasi-2.3.5pre1/lib/kakasi.def
kakasi-2.3.5pre1/lib/libee2.c
kakasi-2.3.5pre1/lib/libkanjiio.c
kakasi-2.3.5pre1/lib/libkakasi.c
kakasi-2.3.5pre1/lib/libg2.c
kakasi-2.3.5pre1/lib/libhh2.c
kakasi-2.3.5pre1/lib/libjj2.c
kakasi-2.3.5pre1/lib/libdict.c
kakasi-2.3.5pre1/lib/lib78_83.c
kakasi-2.3.5pre1/lib/libj2.c
kakasi-2.3.5pre1/lib/liba2.c
kakasi-2.3.5pre1/lib/libkakasi.h
kakasi-2.3.5pre1/lib/libkk2.c
kakasi-2.3.5pre1/lib/libk2.c
kakasi-2.3.5pre1/lib/Makefile.am
kakasi-2.3.5pre1/lib/Makefile.in
kakasi-2.3.5pre1/lib/libitaiji.c
kakasi-2.3.5pre1/lib/makefile.msc.in
kakasi-2.3.5pre1/Makefile.in
kakasi-2.3.5pre1/magic-kakasi
kakasi-2.3.5pre1/ChangeLog
kakasi-2.3.5pre1/config.h.in
plee@sos:~/Japanese/kakasi$ l
total 1304
drwxr-xr-x 7 plee plee 4096 2010-03-21 19:36 kakasi-2.3.5pre1
-rw-r--r-- 1 plee plee 1329263 2010-05-09 09:06 kakasi_2.3.5~pre1+cvs20071101.orig.tar.gz
plee@sos:~/Japanese/kakasi$ cd kakasi-2.3.5pre1/
plee@sos:~/Japanese/kakasi/kakasi-2.3.5pre1$ l
total 3520
-rw-r--r-- 1 plee plee 365083 2010-03-21 19:35 aclocal.m4
-rw-r--r-- 1 plee plee 356 2001-04-12 02:36 AUTHORS
-rw-r--r-- 1 plee plee 19779 2007-11-01 00:00 ChangeLog
-rwxr-xr-x 1 plee plee 44959 2010-03-21 19:35 config.guess
-rw-r--r-- 1 plee plee 2131 2010-03-21 19:35 config.h.in
-rwxr-xr-x 1 plee plee 14987 2004-03-01 23:01 config.rpath
-rwxr-xr-x 1 plee plee 34597 2010-03-21 19:35 config.sub
-rwxr-xr-x 1 plee plee 417371 2010-03-21 19:35 configure
-rw-r--r-- 1 plee plee 2461 2004-09-30 23:03 configure.in
-rw-r--r-- 1 plee plee 35147 2010-03-21 19:35 COPYING
drwxr-xr-x 3 plee plee 4096 2010-03-21 19:35 doc
-rw-r--r-- 1 plee plee 15578 2010-03-21 19:35 INSTALL
-rw-r--r-- 1 plee plee 9618 2000-03-03 22:37 INSTALL-ja
-rwxr-xr-x 1 plee plee 13663 2010-03-21 19:35 install-sh
-rw-r--r-- 1 plee plee 2820 2000-03-03 22:37 itaijidict
-rw-r--r-- 1 plee plee 1058 2000-12-27 01:15 kakasi-config.in
-rw-r--r-- 1 plee plee 2237449 2002-10-02 00:32 kakasidict
-rw-r--r-- 1 plee plee 2789 2010-03-21 19:36 kakasi.spec
-rw-r--r-- 1 plee plee 2789 2001-04-12 23:53 kakasi.spec.in
drwxr-xr-x 2 plee plee 4096 2010-03-21 19:36 lib
-rwxr-xr-x 1 plee plee 243455 2010-03-21 19:35 ltmain.sh
-rw-r--r-- 1 plee plee 113 2003-03-12 06:46 magic-kakasi
-rw-r--r-- 1 plee plee 1632 2001-01-04 09:14 maintMakefile
-rw-r--r-- 1 plee plee 811 2004-03-01 23:01 Makefile.am
-rw-r--r-- 1 plee plee 27109 2010-03-21 19:35 Makefile.in
drwxr-xr-x 2 plee plee 4096 2010-03-21 19:36 man
-rwxr-xr-x 1 plee plee 11419 2010-03-21 19:35 missing
-rw-r--r-- 1 plee plee 3038 2004-07-26 22:57 NEWS
-rw-r--r-- 1 plee plee 5632 2000-03-03 22:37 ONEWS
-rw-r--r-- 1 plee plee 1727 2000-04-26 20:16 README
-rw-r--r-- 1 plee plee 1505 2000-04-26 20:16 README-ja
drwxr-xr-x 2 plee plee 4096 2010-03-21 19:36 src
drwxr-xr-x 2 plee plee 4096 2010-03-21 19:36 tests
-rw-r--r-- 1 plee plee 783 2006-09-21 02:30 THANKS
-rw-r--r-- 1 plee plee 441 2001-04-13 03:02 TODO
我发现编码错误,所以我使用iconv
转换:
plee@sos:~/Japanese/kakasi/kakasi-2.3.5pre1$ vim kakasidict
plee@sos:~/Japanese/kakasi/kakasi-2.3.5pre1$ iconv -f "EUC-JP" -t "UTF8" kakasidict > kakasidict.UTF8
plee@sos:~/Japanese/kakasi/kakasi-2.3.5pre1$ vim kakasidict.UTF8
现在该文件看起来还可以,但有些奇怪的条目的最后一个假名是字母:
173 きづk 気付k
174 つk 付
368 いk 行
653 おりr 下り
发生了什么事?匹配同一动词的几种形式是一种特殊的语法。
例如,
いk
将匹配いく代码>(iku)いけない代码>(ikenai)いかせる代码>(ikaseru)いきたい代码>(ikitai).
它不仅与k
连用,还与所有动词前缀连用,例如参见第たべT食べ代码>,并可能包含所有这些字母:w、e、r、t、y、u、i、o、p、a、s、d、f、g、h、j、k、z、b、n、m
我没有这方面的参考资料,但在检查完文件后,我确信它是这样工作的。
我在维护Kakasi的Java版本,我知道Kakasi的文档非常稀少。这些似乎是字典条目中的某种特殊字符。所以我只想找到添加新条目的规则。然而,我在谷歌上搜索了很多,但运气不好。我发现了几个日本博客网页,但很难阅读。必须有一个官方网站,告诉我们他们是如何组装卡卡西字典的,对吗?嗯,谢谢。我知道一些日语的基本语法。我只是想得到字典里所有字母的规则:k,m,I,r,t
或者更多?你能告诉我处理这封信的代码吗?我的项目要求我列出所有单词的发音,所以我想我需要扩展以获得所有形式的单词,因为我仍然没有完全理解它。你能告诉我kakasi java中的哪些代码是用于扩展的吗?如果食べた代码>和食べて代码>匹配たべT食べ代码>,然后哪个将匹配食べる代码>?也许应该有这样一个条目たべR食べ代码>?
173 きづk 気付k
174 つk 付
368 いk 行
653 おりr 下り