Dictionary .dic行格式定义
我目前正在研究在我正在构建的应用程序中使用的最合适的词典 检查与Sublime Text 2捆绑在一起的词典,文件格式与您所期望的一样—按字母顺序排列的单词列表。然而,这些词中有很多附加了额外的信息。以这个片段为例:Dictionary .dic行格式定义,dictionary,formatting,sublimetext2,aspell,affix,Dictionary,Formatting,Sublimetext2,Aspell,Affix,我目前正在研究在我正在构建的应用程序中使用的最合适的词典 检查与Sublime Text 2捆绑在一起的词典,文件格式与您所期望的一样—按字母顺序排列的单词列表。然而,这些词中有很多附加了额外的信息。以这个片段为例: abaft abbreviation/M abdicate/DNGSn Abelard/M abider/M Abidjan ablaze abloom aboveground abrader/M Abram/M abreaction/MS abrogator/MS abscond
abaft
abbreviation/M
abdicate/DNGSn
Abelard/M
abider/M
Abidjan
ablaze
abloom
aboveground
abrader/M
Abram/M
abreaction/MS
abrogator/MS
abscond/DRSG
absinthe/MS
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
一次毫无结果的谷歌搜索并没有揭示斜杠(/)后面的字母是什么意思
也许它们暗示了这个词的性别,但这只是一个猜测,我更愿意阅读对其含义的正式解释
有人见过这些吗?斜杠后面的字母叫做词缀。这些编码可以是可应用于根单词的前缀或后缀 有关这些词缀的用途的详细说明和示例,请参见 是
aspell
手册。TLDR:斜杠后面的.dic
文件中的每个字母都是.aff
文件中的规则名称
每个规则都位于该语言的.aff文件中。规则有两种
口味:后缀为SFX,前缀为PFX。每行以
PFX/SFX,然后是规则字母标识符(在
字典文件中的单词:
PFX[规则字母标识符][可组合标志]
[遵循的规则行数]
您通常可以忽略combinable标志,它是Y还是N取决于
是否可以与其他规则相结合。然后有一些
列出不同可能性的行数(由指示)
了解此规则在不同情况下的应用方式。如下所示:
PFX[规则字母识别码][字母编号要删除]
[添加内容][何时添加]
例如:
SFX B Y 3
SFX B 0可启用[^aeiou]
SFX B 0可编程ee
SFX B e-able[^aeiou]e
B
是单词后面的字母之一,即someword/B
,则这是
可以应用的规则。有三种可能性
(因为有三行)。只有一行适用:
- 当单词的结尾是而不是(由
表示)时,^
被添加到单词的末尾。字母able
、a
、e
、i
和o
的集合中的一个字母(由u
[/code>表示)。例如,问题→ 可疑的
- 当单词的结尾为
时,able被添加到末尾。例如,agree→ 令人愉快ee
- 当单词的结尾不是元音(
)后跟一个[^aeiou]
)时,将在末尾添加able。字母e
将被删除(able之前的列)。例如,excite→ 易激动e