Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/matlab/13.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何根据上下文对句子中的所有单词进行分类?_Python_Nlp_Pytorch_Text Classification - Fatal编程技术网

Python 如何根据上下文对句子中的所有单词进行分类?

Python 如何根据上下文对句子中的所有单词进行分类?,python,nlp,pytorch,text-classification,Python,Nlp,Pytorch,Text Classification,我有公司的名字(俄语)。名称可以包含缩写、大写字母的单词、小写字母的单词和混合单词。该模型根据以下原则进行训练:输入时,名称以大写形式给出,输出时,名称以“正确”版本给出。例如: ОТДЕЛЕНИЕ СТД РФ (ВТО) - СТД РЕСПУБЛИКИ АДЫГЕЯ -> Отделение СТД РФ (ВТО) - СТД Республики Адыгея ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СИГМА"

我有公司的名字(俄语)。名称可以包含缩写、大写字母的单词、小写字母的单词和混合单词。该模型根据以下原则进行训练:输入时,名称以大写形式给出,输出时,名称以“正确”版本给出。例如:

ОТДЕЛЕНИЕ СТД РФ (ВТО) - СТД РЕСПУБЛИКИ АДЫГЕЯ -> Отделение СТД РФ (ВТО) - СТД Республики Адыгея

ОБЩЕСТВО С ОГРАНИЧЕННОЙ ОТВЕТСТВЕННОСТЬЮ "СИГМА" -> Общество с ограниченной ответственностью "СИГМА"

"ЭЛЕКТРОПРОФСОЮЗ" РБ ОО - "ВЭП" -> "Электропрофсоюз" РБ ОО - "ВЭП" 
然后我必须预测我不知道答案的句子

我试着用注意力和双向GRU制作一个基于角色的seq2seq模型,但是用我尝试过的所有超参数,它似乎都不合适。它可以很好地生成短语的开头,但在结尾它会分解

现在我想我需要使用单词标记。但我不知道是否有方法在上下文中对单个文本中的单词进行分类

我想标记一个句子,并为每个单词指定一个属性,它是什么:大写、小写或首字母大写。此外,我还需要使用一些混合词,如“МöСГСПазз”(或类似于“McDonald's”,它不仅以大写字母开头,而且还包含在内)

也许你需要一个完全不同的方法。我很乐意接受你的帮助

UPD.示例的英文解释:

"SIGMA" LIMITED LIABILITY COMPANY -> "SIGMA" Limited liability company
"SIGMA" LLT -> "SIGMA" LLT
PJSC "GAZPROM"-> PJSC "Gazprom"
STATE BUDGETARY EDUCATIONAL INSTITUTION OF THE CITY OF MOSCOW "LYCEUM NO. 1568" -> State budgetary Educational institution of the city of Moscow "Lyceum No. 1568"

你的英语似乎很好。如果你的例子也是用英语的,那可能会有帮助。@blindguy,好的,我会尝试用英语添加一个解释