Google api 谷歌预测api插入与更新_Google Api_Google Prediction

Google api 谷歌预测api插入与更新

google-api

Google api 谷歌预测api插入与更新,google-api,google-prediction,Google Api,Google Prediction,当使用GooglePredictionAPIv1.6进行分类时，我在使用insert训练模型和更新时得到了不同的行为如果我上传一个csv文件到存储器并使用它来训练insert，或者使用insert方法并在请求中包含训练数据，结果是相同的。也就是说，我使用哪种插入方法并不重要但是，通过插入创建一个空模型，然后通过更新添加所有数据会产生不同的结果预测概率的值非常不同，通过插入创建的模型似乎不受初始训练后更新的影响使用插入，Addr12的预测概率为：预测：Addr12 问题：0.071895

当使用GooglePredictionAPIv1.6进行分类时，我在使用insert训练模型和更新时得到了不同的行为

如果我上传一个csv文件到存储器并使用它来训练insert，或者使用insert方法并在请求中包含训练数据，结果是相同的。也就是说，我使用哪种插入方法并不重要

但是，通过插入创建一个空模型，然后通过更新添加所有数据会产生不同的结果

预测概率的值非常不同，通过插入创建的模型似乎不受初始训练后更新的影响

使用插入，Addr12的预测概率为：预测：Addr12 问题：0.071895标签：登录名问题：0.039216标签：状态问题：0.000000标签：登录类型问题：0.013072标签：SSN 问题：0.052288标签：员工编号问题：0.032680标签：名字问题：0.071895标签：中间名问题：0.052288标签：姓氏问题：0.071895标签：出生日期问题：0.098039标签：性别问题：0.006536标签：合格类别问题：0.019608标签：位置问题：0.104575标签：地址1 问题：0.111111标签：地址2 问题：0.026144标签：城市问题：0.058824标签：拉链问题：0.091503标签：雇用日期问题：0.078431标签：每周工作小时数

使用更新，Addr12的预测概率为：预测：Addr12 问题：0.000000标签：每周工作小时数问题：0.000000标签：雇用日期问题：0.000000标签：Zip 问题：0.000000标签：状态问题：0.000000标签：城市问题：0.527513标签：地址2 问题：0.472487标签：地址1 问题：0.000000标签：位置问题：0.000000标签：合格类别问题：0.000000标签：性别概率：0.000000标签：出生日期问题：0.000000标签：姓氏问题：0.000000标签：中间名问题：0.000000标签：名字问题：0.000000标签：员工编号概率：0.000000标签：SSN 问题：0.000000标签：登录类型问题：0.000000标签：登录名

最后，使用insert后分析的输出包含dataDescription/outputFeature/text以及modelDescription和confusionMatrix。使用更新后的Analyze的输出不包含modelDescription和confusionMatrix否我不简单，在输出中排除这些字段

有人成功地使用insert来训练初始模型，同时能够使用update来改进它吗

---Ed

在使用insert进行初始训练，然后通过update添加更多数据后，分析会看到新的数据dataDescription.outputFeature.text和功能得到更新，但混淆矩阵从未改变。曾经即使添加了新标签。另一个有趣的发现。我的培训数据已经按类别进行了分组。我拿了培训文件，对条目和系统的行为进行了修改。更新似乎确实有效。