Nlp 带有未格式化单词的阿拉伯语WordNet

Nlp 带有未格式化单词的阿拉伯语WordNet,nlp,arabic,wordnet,Nlp,Arabic,Wordnet,输入到WordNet的单词是否需要格式化为اتَّّاحْ而不能期望㶇㶥㶥㶥。。。 是否有任何图书馆或服务机构使用未格式化的阿拉伯语单词,并返回其所有可能的同义词列表。如果你只想删除发音符号,那么你需要一个词汇规范化工具。尝试、下载并安装,然后使用规范化模块: 两个词都是复数。一个是带变音符号的,另一个没有。这不是波斯语,是阿拉伯文。我错了。是的,如果它只是变音,那么它很简单。 from Tashaphyne import * text = 'التُّفَّاحْ' print normal

输入到WordNet的单词是否需要格式化为اتَّّاحْ而不能期望㶇㶥㶥㶥。。。 是否有任何图书馆或服务机构使用未格式化的阿拉伯语单词,并返回其所有可能的同义词列表。

如果你只想删除发音符号,那么你需要一个词汇规范化工具。尝试、下载并安装,然后使用规范化模块:


两个词都是复数。一个是带变音符号的,另一个没有。这不是波斯语,是阿拉伯文。我错了。是的,如果它只是变音,那么它很简单。
from Tashaphyne import *

text = 'التُّفَّاحْ'
print normalize_hamza(text)
print normalize_lamalef(text)
print normalize_searchtext(text)