Google api 谷歌预测api插入与更新

Google api 谷歌预测api插入与更新,google-api,google-prediction,Google Api,Google Prediction,当使用GooglePredictionAPIv1.6进行分类时,我在使用insert训练模型和更新时得到了不同的行为 如果我上传一个csv文件到存储器并使用它来训练insert,或者使用insert方法并在请求中包含训练数据,结果是相同的。也就是说,我使用哪种插入方法并不重要 但是,通过插入创建一个空模型,然后通过更新添加所有数据会产生不同的结果 预测概率的值非常不同,通过插入创建的模型似乎不受初始训练后更新的影响 使用插入,Addr12的预测概率为: 预测:Addr12 问题:0.071895

当使用GooglePredictionAPIv1.6进行分类时,我在使用insert训练模型和更新时得到了不同的行为

如果我上传一个csv文件到存储器并使用它来训练insert,或者使用insert方法并在请求中包含训练数据,结果是相同的。也就是说,我使用哪种插入方法并不重要

但是,通过插入创建一个空模型,然后通过更新添加所有数据会产生不同的结果

预测概率的值非常不同,通过插入创建的模型似乎不受初始训练后更新的影响

使用插入,Addr12的预测概率为: 预测:Addr12 问题:0.071895标签:登录名 问题:0.039216标签:状态 问题:0.000000标签:登录类型 问题:0.013072标签:SSN 问题:0.052288标签:员工编号 问题:0.032680标签:名字 问题:0.071895标签:中间名 问题:0.052288标签:姓氏 问题:0.071895标签:出生日期 问题:0.098039标签:性别 问题:0.006536标签:合格类别 问题:0.019608标签:位置 问题:0.104575标签:地址1 问题:0.111111标签:地址2 问题:0.026144标签:城市 问题:0.058824标签:拉链 问题:0.091503标签:雇用日期 问题:0.078431标签:每周工作小时数

使用更新,Addr12的预测概率为: 预测:Addr12 问题:0.000000标签:每周工作小时数 问题:0.000000标签:雇用日期 问题:0.000000标签:Zip 问题:0.000000标签:状态 问题:0.000000标签:城市 问题:0.527513标签:地址2 问题:0.472487标签:地址1 问题:0.000000标签:位置 问题:0.000000标签:合格类别 问题:0.000000标签:性别 概率:0.000000标签:出生日期 问题:0.000000标签:姓氏 问题:0.000000标签:中间名 问题:0.000000标签:名字 问题:0.000000标签:员工编号 概率:0.000000标签:SSN 问题:0.000000标签:登录类型 问题:0.000000标签:登录名

最后,使用insert后分析的输出包含dataDescription/outputFeature/text以及modelDescription和confusionMatrix。使用更新后的Analyze的输出不包含modelDescription和confusionMatrix否我不简单,在输出中排除这些字段

有人成功地使用insert来训练初始模型,同时能够使用update来改进它吗


---Ed

在使用insert进行初始训练,然后通过update添加更多数据后,分析会看到新的数据dataDescription.outputFeature.text和功能得到更新,但混淆矩阵从未改变。曾经即使添加了新标签。另一个有趣的发现。我的培训数据已经按类别进行了分组。我拿了培训文件,对条目和系统的行为进行了修改。更新似乎确实有效。