C++ 加快TF服务推断时间
我有一个模型,它接受2个3d张量,输出一个4d张量。该型号的protobuf版本约为750MB。在Windows 10机上建立/运行C++推理可执行文件,并使用CPU。C++ 加快TF服务推断时间,c++,tensorflow,tensorflow-serving,bert-language-model,C++,Tensorflow,Tensorflow Serving,Bert Language Model,我有一个模型,它接受2个3d张量,输出一个4d张量。该型号的protobuf版本约为750MB。在Windows 10机上建立/运行C++推理可执行文件,并使用CPU。 >P>我有一个C++代码,它使用TysFrace.DLL每次加载模型并进行前向传递。(如本文所述)。运行时间约为55到70秒,其中一个主要部分是模型加载和图形构建时间(约为25秒) 为了加快运行时间,移动到使用TF-Serve-docker(like)为模型提供服务。现在,整个运行时间减少到20到40秒之间。这里向前传球的时