OCaml中的Logistic回归

OCaml中的Logistic回归,ocaml,ocamlbuild,ocamlfind,Ocaml,Ocamlbuild,Ocamlfind,我试图在OCaml中使用逻辑回归。我需要用它作为我正在解决的另一个问题的黑盒。我发现了以下网站: 我从该站点将以下代码(经过一些修改-我定义了自己的iris_功能和iris_标签)粘贴到一个名为logistic_regression.ml的文件中: open Scanf open Format open Bigarray open Lacaml.D let log_reg ?(lambda=0.1) x y = (* [f_df] returns the value of the fun

我试图在OCaml中使用逻辑回归。我需要用它作为我正在解决的另一个问题的黑盒。我发现了以下网站:

我从该站点将以下代码(经过一些修改-我定义了自己的iris_功能和iris_标签)粘贴到一个名为logistic_regression.ml的文件中:

open Scanf
open Format
open Bigarray
open Lacaml.D

let log_reg ?(lambda=0.1) x y =
  (* [f_df] returns the value of the function to maximize and store
     its gradient in [g]. *)
  let f_df w g =
    let s = ref 0. in
    ignore(copy ~y:g w); (* g ← w *)
    scal (-. lambda) g;  (* g = -λ w *)
    for i = 0 to Array.length x - 1 do
      let yi = float y.(i) in
      let e = exp(-. yi *. dot w x.(i)) in
      s := !s +. log1p e;
      axpy g ~alpha:(yi *. e /. (1. +. e)) ~x:x.(i);
    done;
    -. !s -. 0.5 *. lambda *. dot w w
  in
  let w = Vec.make0 (Vec.dim x.(0)) in
  ignore(Lbfgs.F.max f_df w);
  w


let iris_features = [1 ; 2 ; 3] ;;
let iris_labels = 2 ;;

let proba w x y = 1. /. (1. +. exp(-. float y *. dot w x))
let () =
  let sol = log_reg iris_features iris_labels in
  printf "w = %a\n" Lacaml.Io.pp_fvec sol;
  let nwrongs = ref 0 in
  for i = 0 to Array.length iris_features - 1 do
    let p = proba sol iris_features.(i) iris_labels.(i) in
    printf "Label = %i prob = %g => %s\n" iris_labels.(i) p
      (if p > 0.5 then "correct" else (incr nwrongs; "wrong"))
  done;
  printf "Number of wrong labels: %i\n" !nwrongs
我有以下问题:

  • 在尝试编译代码时,我收到错误消息:“
    错误:unboundmodule Lacaml
    ”。我安装了Lacaml;多次执行opam init,试图提供一个标志-package=Lacaml;我不知道怎么解决这个问题
  • 如您所见,我已经定义了我自己版本的iris_功能和iris_标签-类型正确吗,即在函数日志中_reg是x int list的类型,而y是int的类型

  • iris_功能
    iris_标签
    都是数组,OCaml中的数组文字用
    [
    ][/code>样式的括号分隔,例如

    
    let iris_features = [|(* I don't know what to put here*)|]
    let iris_labels = [|2|]
    
    iris\u features
    数组具有类型
    vec array
    ,即向量数组,而不是整数数组,我不是挖得太深而不知道放在那里的是什么,但语法如下所示

    let iris_features =[|
      Vec.of_list [1.; 2.; 3.;];
      Vec.of_list [4.; 5.; 6.;];
    |]
    
    自从编写代码以来,Lacaml接口发生了一些变化,
    axpy
    不再接受带标签的
    ~x
    参数(现在x和y向量都是位置向量),因此需要删除
    ~x
    并修复顺序(我假定
    x.(I)
    a*x+y
    表达式中的
    x
    ,并且
    g
    对应于
    y
    ,例如

     axpy ~alpha:(yi *. e /. (1. +. e)) x.(i) g;
    
    此代码还依赖于
    lbfgs
    ,因此您也需要安装它

    opam depext --install lbfgs
    
    我建议您使用默认的构建系统,但对于快速原型,您可以使用
    ocamlbuild
    。将代码放入名为
    regresse.ml
    的文件中的空文件夹中(您可以选择其他名称,只需相应地更新构建说明),现在您可以将其构建为本机可执行文件,如下所示

    ocamlbuild -pkg lacaml -pkg lbfgs regress.native
    
    以同样的方式运行它

    ./regress.native
    
    如果您在OCaml顶级(也称为解释器,即在
    OCaml
    解释器中运行代码),您可以使用以下两个指令加载
    lacaml
    lbfgs

    #use "topfind";;
    #require "lacaml.top";;
    #require "lbfgs";;
    
    #
    不是提示,而是指令语法的一部分,所以别忘了键入它)

    现在,您可以将代码复制粘贴到解释器中并使用它

    有奖赛道建设与沙丘
  • 创建一个空文件夹,并将
    regresse.ml
    放在那里
  • 删除
    open Bigarray
    open Scanf
    ,因为dune对警告非常严格,并且会将它们变成错误(它会在这些行上向您发出警告,因为它们实际上是未使用的)
  • 创建沙丘项目
  • 构建并运行

  • 现在无法深入研究这个问题,但我注意到您正在将
    iris_功能
    传递到
    Array.length
    ,但该函数需要一个数组,而不是一个列表。您可以使用文本
    iris_功能
    绑定到一个等效数组。
    dune init exe regress --libs lacaml,lbfgs
    
    dune exec ./regress.exe