Dictionary .dic行格式定义

Dictionary .dic行格式定义,dictionary,formatting,sublimetext2,aspell,affix,Dictionary,Formatting,Sublimetext2,Aspell,Affix,我目前正在研究在我正在构建的应用程序中使用的最合适的词典 检查与Sublime Text 2捆绑在一起的词典,文件格式与您所期望的一样—按字母顺序排列的单词列表。然而,这些词中有很多附加了额外的信息。以这个片段为例: abaft abbreviation/M abdicate/DNGSn Abelard/M abider/M Abidjan ablaze abloom aboveground abrader/M Abram/M abreaction/MS abrogator/MS abscond

我目前正在研究在我正在构建的应用程序中使用的最合适的词典

检查与Sublime Text 2捆绑在一起的词典,文件格式与您所期望的一样—按字母顺序排列的单词列表。然而,这些词中有很多附加了额外的信息。以这个片段为例:

abaft
abbreviation/M
abdicate/DNGSn
Abelard/M
abider/M
Abidjan
ablaze
abloom
aboveground
abrader/M
Abram/M
abreaction/MS
abrogator/MS
abscond/DRSG
absinthe/MS
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
一次毫无结果的谷歌搜索并没有揭示斜杠(/)后面的字母是什么意思

也许它们暗示了这个词的性别,但这只是一个猜测,我更愿意阅读对其含义的正式解释


有人见过这些吗?

斜杠后面的字母叫做词缀。这些编码可以是可应用于根单词的前缀或后缀

有关这些词缀的用途的详细说明和示例,请参见

aspell
手册。

TLDR:斜杠后面的
.dic
文件中的每个字母都是
.aff
文件中的规则名称

每个规则都位于该语言的.aff文件中。规则有两种 口味:后缀为SFX,前缀为PFX。每行以 PFX/SFX,然后是规则字母标识符(在 字典文件中的单词:

PFX[规则字母标识符][可组合标志]
[遵循的规则行数]

您通常可以忽略combinable标志,它是Y还是N取决于 是否可以与其他规则相结合。然后有一些 列出不同可能性的行数(由指示) 了解此规则在不同情况下的应用方式。如下所示:

PFX[规则字母识别码][字母编号要删除]
[添加内容][何时添加]

例如:

  • SFX B Y 3
  • SFX B 0可启用[^aeiou]
  • SFX B 0可编程ee
  • SFX B e-able[^aeiou]e
如果
B
是单词后面的字母之一,即
someword/B
,则这是 可以应用的规则。有三种可能性 (因为有三行)。只有一行适用:

  • 当单词的结尾是而不是(由
    ^
    表示)时,
    able
    被添加到单词的末尾。字母
    a
    e
    i
    o
    u
    的集合中的一个字母(由
    [/code>表示)。例如,问题→ 可疑的
  • 当单词的结尾为
    ee
    时,able被添加到末尾。例如,agree→ 令人愉快
  • 当单词的结尾不是元音(
    [^aeiou]
    )后跟一个
    e
    )时,将在末尾添加able。字母
    e
    将被删除(able之前的列)。例如,excite→ 易激动
PFX规则是相同的,但适用于单词的开头 用于前缀