Julia 在列车和测试向量数据集中保持相同的装箱
我有一个数值向量Julia 在列车和测试向量数据集中保持相同的装箱,julia,Julia,我有一个数值向量train,用于模型的训练数据集。假设我想把它切成5个箱子。我知道我可以使用categoricalarray.jl中的cut(x,5)来完成。如何从模型的测试数据集在测试向量中设置相同的装箱?也许有更好的解决方案,但这会起作用: using CategoricalArrays, Statistics nbins = 5 breaks = Statistics.quantile(train, (1:nbins-1)/nbins) cat_train = cut(train, b
train
,用于模型的训练数据集。假设我想把它切成5个箱子。我知道我可以使用categoricalarray.jl中的cut(x,5)
来完成。如何从模型的测试数据集在测试
向量中设置相同的装箱?也许有更好的解决方案,但这会起作用:
using CategoricalArrays, Statistics
nbins = 5
breaks = Statistics.quantile(train, (1:nbins-1)/nbins)
cat_train = cut(train, breaks;extend=true,labels=string.("BIN_",1:5))
cat_test = cut(test, breaks;extend=true,labels=string.("BIN_",1:5))