Speech recognition 神经网络期望';ivector';尺寸为100但您提供了0的功能

Speech recognition 神经网络期望';ivector';尺寸为100但您提供了0的功能,speech-recognition,kaldi,Speech Recognition,Kaldi,我正在用gooofy zamia的演讲为kaldi的一个项目改编模型 我按照给出的步骤使用kaldi-generic-de-tdnn_f-r20190328模型创建模型 当我在.wav文件上测试它时,它显示了以下错误: ////// nnet3 latgen faster--帧子采样因子=3--每个块的帧数=50--额外左侧上下文=0--额外右侧上下文=0--额外左侧上下文初始=-1--额外右侧上下文最终=-1--最小化=false--最大活动=7000--最小活动=200--波束=15.0-

我正在用gooofy zamia的演讲为kaldi的一个项目改编模型

我按照给出的步骤使用kaldi-generic-de-tdnn_f-r20190328模型创建模型

当我在.wav文件上测试它时,它显示了以下错误:


//////
nnet3 latgen faster--帧子采样因子=3--每个块的帧数=50--额外左侧上下文=0--额外右侧上下文=0--额外左侧上下文初始=-1--额外右侧上下文最终=-1--最小化=false--最大活动=7000--最小活动=200--波束=15.0--晶格波束=8.0--声学比例=1.0--允许部分=true--word symbol table=exp/api.ai-model/words.txt exp/api.ai-model/final.mdl exp/api.ai-model//HCLG.fst'ark,s,cs:apply cmvn--norm means=false--norm vars=false--utt2spk=ark:data/test corpus/utt2spk scp:data/test corpus/cmvn.scp scp:data/test corpus/feats.scp ark:feats.scp ark:-|''ark:|格子尺度--声学尺度=10.0 ark:->exp/lat.1'
日志(nnet3 latgen faster[5.5.628~1-ac6b1]:RemoveOrphannedNodes():nnet nnet.cc:948)删除了1个孤立节点。
日志(nnet3 latgen faster[5.5.628~1-ac6b1]:RemoveOrphandComponents():nnet nnet.cc:847)删除2个孤立组件。
日志(nnet3 latgen faster[5.5.628~1-ac6b1]:Collapse():nnet utils.cc:1472)添加了1个组件,删除了2个
格点比例尺——声学比例尺=10.0方格:-
应用cmvn--norm means=false--norm vars=false--utt2spk=ark:data/test corpus/utt2spk scp:data/test corpus/cmvn.scp scp:data/test corpus/feats.scp ark:-
LOG(apply cmvn[5.5.628~1-ac6b1]:main():apply cmvn.cc:81)复制了1条语句。
LOG(nnet3 latgen faster[5.5.628~1-ac6b1]:CheckAndFixConfigs():nnet am decodable simple.cc:294)将--frames per chunk从50增加到51,使其成为--frames subsampling factor=3的倍数
错误(nnet3 latgen faster[5.5.628~1-ac6b1]:EnsureReframeComputed():nnet am decodable simple.cc:105)神经网络需要维度为100的“ivector”特征,但您提供了0
[堆栈跟踪:]
nnet3 latgen更快(kaldi::MessageLogger::LogMessage()常量+0x82c)[0x8ab31c]
nnet3 latgen更快(kaldi::MessageLogger::Loganthrow::operator=(kaldi::MessageLogger const&)+0x21)[0x55786b]
nnet3 latgen更快(kaldi::nnet3::DecodableNnetSimple::EnsureReframeComputed(int)+0x298)[0x5dbcfa]
nnet3 latgen更快(kaldi::nnet3::DecodableanNetSimple::对数似然(int,int)+0x40)[0x5dc27a]
nnet3 latgen更快(kaldi::LatticeFasterDecoderTpl::ProcessEmitting(kaldi::DecodableInterface*)+0x22f)[0x73873d]
nnet3 latgen更快(kaldi::LatticeFasterDecoderTpl::高级编码(kaldi::DecodableInterface*,int)+0x97)[0x738b1d]
nnet3 latgen更快(kaldi::LatticeFasterDecoderTpl::高级编码(kaldi::DecodableInterface*,int)+0x41)[0x738bc9]
nnet3 latgen更快(kaldi::LatticeFasterDecoderTpl::Decode(kaldi::DecodableInterface*)+0x21)[0x738d19]
nnet3 latgen faster(布尔-卡尔迪::解码器LatticeFaster(卡尔迪::LatticeFasterDecodeTPL&,卡尔迪::DecodableInterface&,卡尔迪::TransitionModel const&,fst::SymbolTable const*,std:uu cxx11::基本字符串,双精度,布尔,布尔,布尔,卡尔迪::TableWriter*,卡尔迪::TableWriter*,卡尔迪::TableWriter*,卡尔迪::TableWriter*,双精度*)+0x88)[0x76a629]
nnet3车床速度更快(主+0xfd2)[0x553c98]
/lib/x86_64-linux-gnu/libc.so.6(libc_start_main+0xf0)[0x7fbe85da5840]
nnet3 latgen速度更快(启动+0x29)[0x552bf9]
警告(nnet3 latgen faster[5.5.628~1-ac6b1]:~HashList():util/hash list inl.h:117)可能的内存泄漏:1023!=1024:您可能忘记对某些元素调用Delete
LOG(lattice scale[5.5.628~1-ac6b1]:main():lattice scale.cc:107)完成0个晶格。
警告(nnet3 latgen faster[5.5.628~1-ac6b1]:Close():kaldi io.cc:333)管道|晶格刻度--声学刻度=10.0 ark:-ark:->exp/lat.1具有非零返回状态256
有人能帮我吗?


提前谢谢你

消息说您需要提取ivectors并将其传递给识别器,其中包含--online ivectors和--ivectors消息说您需要提取ivectors并将其传递给识别器,其中包含--online ivectors和--ivectors
//////
nnet3-latgen-faster --frame-subsampling-factor=3 --frames-per-chunk=50 --extra-left-context=0 --extra-right-context=0 --extra-left-context-initial=-1 --extra-right-context-final=-1 --minimize=false --max-active=7000 --min-active=200 --beam=15.0 --lattice-beam=8.0 --acoustic-scale=1.0 --allow-partial=true --word-symbol-table=exp/api.ai-model/words.txt exp/api.ai-model/final.mdl exp/api.ai-model//HCLG.fst 'ark,s,cs:apply-cmvn --norm-means=false --norm-vars=false --utt2spk=ark:data/test-corpus/utt2spk scp:data/test-corpus/cmvn.scp scp:data/test-corpus/feats.scp ark:- |' 'ark:|lattice-scale --acoustic-scale=10.0 ark:- ark:-  >exp/lat.1' 
LOG (nnet3-latgen-faster[5.5.628~1-ac6b1]:RemoveOrphanNodes():nnet-nnet.cc:948) Removed 1 orphan nodes.
LOG (nnet3-latgen-faster[5.5.628~1-ac6b1]:RemoveOrphanComponents():nnet-nnet.cc:847) Removing 2 orphan components.
LOG (nnet3-latgen-faster[5.5.628~1-ac6b1]:Collapse():nnet-utils.cc:1472) Added 1 components, removed 2
lattice-scale --acoustic-scale=10.0 ark:- ark:- 
apply-cmvn --norm-means=false --norm-vars=false --utt2spk=ark:data/test-corpus/utt2spk scp:data/test-corpus/cmvn.scp scp:data/test-corpus/feats.scp ark:- 
LOG (apply-cmvn[5.5.628~1-ac6b1]:main():apply-cmvn.cc:81) Copied 1 utterances.
LOG (nnet3-latgen-faster[5.5.628~1-ac6b1]:CheckAndFixConfigs():nnet-am-decodable-simple.cc:294) Increasing --frames-per-chunk from 50 to 51 to make it a multiple of --frame-subsampling-factor=3
ERROR (nnet3-latgen-faster[5.5.628~1-ac6b1]:EnsureFrameIsComputed():nnet-am-decodable-simple.cc:105) Neural net expects 'ivector' features with dimension 100 but you provided 0

[ Stack-Trace: ]
nnet3-latgen-faster(kaldi::MessageLogger::LogMessage() const+0x82c) [0x8ab31c]
nnet3-latgen-faster(kaldi::MessageLogger::LogAndThrow::operator=(kaldi::MessageLogger const&)+0x21) [0x55786b]
nnet3-latgen-faster(kaldi::nnet3::DecodableNnetSimple::EnsureFrameIsComputed(int)+0x298) [0x5dbcfa]
nnet3-latgen-faster(kaldi::nnet3::DecodableAmNnetSimple::LogLikelihood(int, int)+0x40) [0x5dc27a]
nnet3-latgen-faster(kaldi::LatticeFasterDecoderTpl<fst::ConstFst<fst::ArcTpl<fst::TropicalWeightTpl<float> >, unsigned int>, kaldi::decoder::StdToken>::ProcessEmitting(kaldi::DecodableInterface*)+0x22f) [0x73873d]
nnet3-latgen-faster(kaldi::LatticeFasterDecoderTpl<fst::ConstFst<fst::ArcTpl<fst::TropicalWeightTpl<float> >, unsigned int>, kaldi::decoder::StdToken>::AdvanceDecoding(kaldi::DecodableInterface*, int)+0x97) [0x738b1d]
nnet3-latgen-faster(kaldi::LatticeFasterDecoderTpl<fst::Fst<fst::ArcTpl<fst::TropicalWeightTpl<float> > >, kaldi::decoder::StdToken>::AdvanceDecoding(kaldi::DecodableInterface*, int)+0x41) [0x738bc9]
nnet3-latgen-faster(kaldi::LatticeFasterDecoderTpl<fst::Fst<fst::ArcTpl<fst::TropicalWeightTpl<float> > >, kaldi::decoder::StdToken>::Decode(kaldi::DecodableInterface*)+0x21) [0x738d19]
nnet3-latgen-faster(bool kaldi::DecodeUtteranceLatticeFaster<fst::Fst<fst::ArcTpl<fst::TropicalWeightTpl<float> > > >(kaldi::LatticeFasterDecoderTpl<fst::Fst<fst::ArcTpl<fst::TropicalWeightTpl<float> > >, kaldi::decoder::StdToken>&, kaldi::DecodableInterface&, kaldi::TransitionModel const&, fst::SymbolTable const*, std::__cxx11::basic_string<char, std::char_traits<char>, std::allocator<char> >, double, bool, bool, kaldi::TableWriter<kaldi::BasicVectorHolder<int> >*, kaldi::TableWriter<kaldi::BasicVectorHolder<int> >*, kaldi::TableWriter<kaldi::CompactLatticeHolder>*, kaldi::TableWriter<kaldi::LatticeHolder>*, double*)+0x88) [0x76a629]
nnet3-latgen-faster(main+0xfd2) [0x553c98]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf0) [0x7fbe85da5840]
nnet3-latgen-faster(_start+0x29) [0x552bf9]

WARNING (nnet3-latgen-faster[5.5.628~1-ac6b1]:~HashList():util/hash-list-inl.h:117) Possible memory leak: 1023 != 1024: you might have forgotten to call Delete on some Elems
LOG (lattice-scale[5.5.628~1-ac6b1]:main():lattice-scale.cc:107) Done 0 lattices.
WARNING (nnet3-latgen-faster[5.5.628~1-ac6b1]:Close():kaldi-io.cc:333) Pipe |lattice-scale --acoustic-scale=10.0 ark:- ark:-  >exp/lat.1 had nonzero return status 256