Neural network 窗口字嵌入中的启动标记
我正在使用预先训练过的SENNA嵌入,并将一个3个单词的窗口输入到一个密集的神经网络中 senna是否有开始或结束标记嵌入? 还是创建一个随机向量Neural network 窗口字嵌入中的启动标记,neural-network,nlp,nltk,lstm,named-entity-recognition,Neural Network,Nlp,Nltk,Lstm,Named Entity Recognition,我正在使用预先训练过的SENNA嵌入,并将一个3个单词的窗口输入到一个密集的神经网络中 senna是否有开始或结束标记嵌入? 还是创建一个随机向量 Sentence: 'McDonalds sells fries' input 1: ['<s>', 'McDonalds', 'sells'] 一句:“麦当劳卖薯条” 输入1:['','麦当劳','销售'] 但是没有嵌入。。。 我自己创造吗?(例如,all-1)?阅读主页上的标记化和(包括特殊的句子边界标记)正在内部处理 你想把
Sentence: 'McDonalds sells fries'
input 1: ['<s>', 'McDonalds', 'sells']
一句:“麦当劳卖薯条”
输入1:['','麦当劳','销售']
但是没有嵌入
。。。
我自己创造吗?(例如,all-1)?阅读主页上的标记化和(包括特殊的句子边界标记)正在内部处理
你想把它们包括在内有什么原因吗?
从网站上看,它们似乎隐含在输入上下文中(一句话)
摘自网站:
Usage
SENNA reads input sentences from the standard input
and outputs tags into the standard output.
The most likely command line usage for SENNA is therefore:
senna [options] < input.txt > output.txt
Of course you can run SENNA in an interactive mode
without the "pipes" < and >.
Each input line is considered as a sentence.
SENNA has its own tokenizer for separating words,
which can be deactivated with the -usrtokens option.
用法
塞纳从标准输入法中读出输入句
并将标记输出到标准输出中。
因此,SENNA最可能的命令行用法是:
senna[选项]output.txt
当然,您可以在交互模式下运行SENNA
没有“管道”<和>。
每个输入行都被视为一个句子。
塞纳有自己的分词标记器,
可以使用-usrtokens选项停用。
阅读主页上的标记化(包括特殊的句子边界标记)似乎在内部处理
你想把它们包括在内有什么原因吗?
从网站上看,它们似乎隐含在输入上下文中(一句话)
摘自网站:
Usage
SENNA reads input sentences from the standard input
and outputs tags into the standard output.
The most likely command line usage for SENNA is therefore:
senna [options] < input.txt > output.txt
Of course you can run SENNA in an interactive mode
without the "pipes" < and >.
Each input line is considered as a sentence.
SENNA has its own tokenizer for separating words,
which can be deactivated with the -usrtokens option.
用法
塞纳从标准输入法中读出输入句
并将标记输出到标准输出中。
因此,SENNA最可能的命令行用法是:
senna[选项]output.txt
当然,您可以在交互模式下运行SENNA
没有“管道”<和>。
每个输入行都被视为一个句子。
塞纳有自己的分词标记器,
可以使用-usrtokens选项停用。