如何利用python获取sklearn中svm算法的置信度_Python_Image Processing_Scikit Learn_Svm

如何利用python获取sklearn中svm算法的置信度

python image-processing scikit-learn

如何利用python获取sklearn中svm算法的置信度,python,image-processing,scikit-learn,svm,Python,Image Processing,Scikit Learn,Svm,我想获得信心，但当我尝试clf.score（X\u测试）时，我得到以下错误： TypeError:score（）至少接受3个参数（给定2个）这是我的代码： import cv2, os from numpy import * import numpy as np from PIL import Image from sklearn.decomposition import PCA from sklearn.decomposition import RandomizedPCA from skle

我想获得信心，但当我尝试

clf.score（X\u测试）

时，我得到以下错误：

TypeError:score（）至少接受3个参数（给定2个）

这是我的代码：

import cv2, os
from numpy import *
import numpy as np
from PIL import Image
from sklearn.decomposition import PCA
from sklearn.decomposition import RandomizedPCA
from sklearn.naive_bayes import GaussianNB
import matplotlib.pyplot as plt
from sklearn.svm import SVC

cascadeLocation = "haarcascade_frontalface_default.xml"
faceCascade = cv2.CascadeClassifier(cascadeLocation)

def prepare_dataset(directory):
    paths = [os.path.join(directory, filename) for filename in os.listdir(directory)]
    images = []
    labels = []
    row = 140
    col = 140
    for image_path in paths:

        image_pil = Image.open(image_path).convert('L')

        image = np.array(image_pil, 'uint8')
        nbr = int(os.path.split(image_path)[-1].split('.')[1])
        print(nbr)
        faces = faceCascade.detectMultiScale(image)
        for (x,y,w,h) in faces:
            images.append(image[y:y+col,x:x+row])
            labels.append(nbr)
            cv2.imshow("Reading Faces ",image[y:y+col,x:x+row])
            cv2.waitKey(50)
    return images,labels, row, col

directory = 'dataset'
directory2 = 'dataset2'
images, labels, row, col = prepare_dataset(directory)

n_components = 10
cv2.destroyAllWindows()
pca = PCA(n_components=n_components, whiten=True)

param_grid = {'C': [1e3, 5e3, 1e4, 5e4, 1e5],
              'gamma': [0.0001, 0.0005, 0.001, 0.005, 0.01, 0.1], }
clf = SVC(kernel='rbf', class_weight='balanced')

testing_data = []
for i in range(len(images)):
    testing_data.append(images[i].flatten())
pca = pca.fit(testing_data)

transformed = pca.transform(testing_data)
clf.fit(transformed,labels)

image_paths = [os.path.join(directory2, filename) for filename in os.listdir(directory2)]
la=[]
for image_path in image_paths:
    pred_image_pil = Image.open(image_path).convert('L')

    pred_image = np.array(pred_image_pil, 'uint8')

    faces = faceCascade.detectMultiScale(pred_image)
    for (x,y,w,h) in faces:
        temp=np.array(pred_image[y:y+col,x:x+row]).reshape((1, -1))

        X_test = pca.transform(temp)

        id = clf.predict(X_test)
        #a=clf.score(X_test)            
        if(id==1):
            id="john"
        elif(id==2):
            id="brad"
        elif(id==3):
            id="scr"
        elif(id==4):
            id="natalie portman"
        elif(id==5):
            id="jennifer lawrence"
        elif(id==6):
            id="van diesel"
        elif(id==7):
            id="jennifer aniston"
        elif(id==8):
            id="leonardo dicaprio"    
        else :
            id="unknown"
        print(id)               
        cv2.imshow("Recognizing Face", pred_image[y: y + h, x: x + w])
        cv2.waitKey(1000)
cv2.destroyAllWindows()

我还尝试了

clf.score（X_测试，id）

。在这种情况下，所有置信度都从（强调项）中获取值

1.0

：

决策函数（X）

预测样本的信心分数。
样本的置信度得分是该样本到超平面的有符号距离
您必须将代码中的
a=clf.score（X\u测试）
更改为
a=clf.decision\u函数（X\u测试）
编辑
我猜您实际上希望通过检查
dataset2
的图像是否被识别来“手动”验证您的模型。在这种情况下，您需要在代码中引入一些更改：

把他的句子放在外循环的最开始处：

nbr2 = int(os.path.split(image_path)[-1].split('.')[1])
我假设
dataset2
的文件命名约定与
dataset1
的相同，否则您必须相应地重新定义
nbr2

不要使用
id
作为变量名，因为
id
在Python中是一个保留字。您可以使用
idx
：

idx = clf.predict(X_test)

如果elif else语句是复合的，则将其替换为字典（在for循环之外）：
并将
print（id）
更改为
print（names.get（idx，未知））

最后，将
a=clf.score（X_测试）
替换为
a=clf.score（X_测试，nbr2）

这不是来自opencv的svm，而是来自sklearn@jakevdp你能帮帮我吗？我第一次可能误解了你的问题。我编辑了我的答案，以便更符合你的要求。
names = {1: "john", 2: "brad", 3: "scr", 4: "natalie portman", 5: "jennifer lawrence", 6: "van diesel", 7: "jennifer aniston", 8: "leonardo dicaprio", }