Apache spark pyspark中的paramGrid中存在错误
我正在使用paramGrid微调模型参数。下面是下面的代码Apache spark pyspark中的paramGrid中存在错误,apache-spark,pyspark,pyspark-sql,apache-spark-ml,Apache Spark,Pyspark,Pyspark Sql,Apache Spark Ml,我正在使用paramGrid微调模型参数。下面是下面的代码 windowSize=5 最小计数=10 矢量大小=300 maxIter=[101001000] regParam=[0.1,0.01] paramGrid=ParamGridBuilder()\ .addGrid(q1w2model.setWindowsSize,WindowsSize)\ .addGrid(q1w2model.setMinCount,minCount)\ .addGrid(q2w2model.setWindowsS
windowSize=5
最小计数=10
矢量大小=300
maxIter=[101001000]
regParam=[0.1,0.01]
paramGrid=ParamGridBuilder()\
.addGrid(q1w2model.setWindowsSize,WindowsSize)\
.addGrid(q1w2model.setMinCount,minCount)\
.addGrid(q2w2model.setWindowsSize,WindowsSize)\
.addGrid(q2w2model.setMinCount,minCount)\
.addGrid(q1w2model.setVectorSize,vectorSize)\
.addGrid(q2w2model.setVectorSize,vectorSize)\
.addGrid(lr.setMaxIter,maxIter)\
.addGrid(lr.setRegParam,regParam)\
.build()
tvs=列车验证分裂(估计器=管道,
参数映射=参数网格,
evaluator=BinaryClassificationEvaluator(),
列车传动比=0.8)
model=tvs.fit(train)#model是具有最佳性能参数组合的模型
以下是回溯调用:
文件“/home/PycharmProjects/untitled1/quora_feaures_pyspark.py”,第406行,在
.addGrid(lr.setRegParam,regParam)\
文件“/usr/local/lib/python2.7/dist-packages/pyspark/ml/tuning.py”,第115行,内部版本
返回itertools.product(*grid_值)中产品的[dict(zip(键,产品))]
TypeError:“int”对象不可编辑
ParamGridBuilder.add_grid
方法需要一个可匹配的数据类型,其中您将windowSize
、minCount
和vectorSize
作为整数传递到add_grid
。您需要将这些变量更改为类似于其他网格搜索参数的列表,以解决错误