Warning: file_get_contents(/data/phpspider/zhask/data//catemap/3/apache-spark/6.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Apache spark Spark中的评分Logistic回归模型代码_Apache Spark_Pyspark - Fatal编程技术网

Apache spark Spark中的评分Logistic回归模型代码

Apache spark Spark中的评分Logistic回归模型代码,apache-spark,pyspark,Apache Spark,Pyspark,我是Spark的新手,我有一些逻辑回归模型分数代码,是用另一种语言构建的,我正在转换为在Spark中运行。此模型代码驻留在文本文件中。下面是模型代码的示例 score = 0.27491575973075 + (residence ='7' )*-0.17704835393105 + (residence ='8' )*-0.17704835393105 + (state =9 )*0.64242832288369 + (state =1 )*-0.15066703353302 + (state

我是Spark的新手,我有一些逻辑回归模型分数代码,是用另一种语言构建的,我正在转换为在Spark中运行。此模型代码驻留在文本文件中。下面是模型代码的示例

score = 0.27491575973075
+ (residence ='7' )*-0.17704835393105
+ (residence ='8' )*-0.17704835393105
+ (state =9 )*0.64242832288369
+ (state =1 )*-0.15066703353302
+ (state =2 )*-0.12015049320814
+ (state =8 )*-0.12015049320814
;
prob=score/(1+e^score);
上面的截距为0.27491575973075,并根据该行的列是否为标记的值来增加/减少该值。一旦语句完成,它将通过logit转换来接收概率分数(prob)

i、 e.+(住宅='7')-0.17704835393105执行if检查,查看住宅是否等于7,如果等于7,则该行将为+(1)-0.17704835393105-->+(-0.177048353105)

我正试图在Spark中实现类似的东西。除上述摘录中列出的值外,每列都有其他值。 i、 e.住宅的值为1-9,州的值为1-52

有没有一种方法可以对分散在这个线性公式中的if语句执行类似的操作