Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/image/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 如何通过鼠标单击而不是猜测获得ROI边界框坐标&;检查_Python_Image_Opencv_Image Processing_Python Imaging Library - Fatal编程技术网

Python 如何通过鼠标单击而不是猜测获得ROI边界框坐标&;检查

Python 如何通过鼠标单击而不是猜测获得ROI边界框坐标&;检查,python,image,opencv,image-processing,python-imaging-library,Python,Image,Opencv,Image Processing,Python Imaging Library,因此,我试图截取我的显示器的屏幕截图,这样做时只抓取屏幕的一部分。我知道我可以使用mss或opencv、枕头或任何其他支持边界框的屏幕截图库。。。然而,不是随机猜测坐标是什么。。。我的意思是,拍摄一个屏幕截图,设置边界框坐标,看看它是否接近我想要得到的图片 例如:我的试验坐标是10,10500500,而实际上我需要的实际坐标是15,40200300(这些坐标是合成的) 我解决这个问题的想法是使用一个工具,允许我在需要的图像(屏幕的一部分)周围单击并拖动一个边界框,然后让程序返回结果,例如15

因此,我试图截取我的显示器的屏幕截图,这样做时只抓取屏幕的一部分。我知道我可以使用mss或opencv、枕头或任何其他支持边界框的屏幕截图库。。。然而,不是随机猜测坐标是什么。。。我的意思是,拍摄一个屏幕截图,设置边界框坐标,看看它是否接近我想要得到的图片


例如:我的试验坐标是10,10500500,而实际上我需要的实际坐标是15,40200300(这些坐标是合成的)


我解决这个问题的想法是使用一个工具,允许我在需要的图像(屏幕的一部分)周围单击并拖动一个边界框,然后让程序返回结果,例如15,402003。此外,如果我的盒子可以画出来,因为它显示,这将是非常有用的! 如果有另一种方法来实现这个目标,我也愿意接受



谢谢。

方法是在感兴趣的区域周围单击并拖动边界框以获得坐标。为此,我们必须捕获鼠标点击的事件动作,并记录ROI的开始和结束坐标。OpenCV允许我们通过处理鼠标点击事件来实现这一点。每当触发鼠标点击事件时,OpenCV都会将信息传递给我们的
提取坐标
回调函数。为了处理事件,OpenCV需要各种参数:

  • 事件:发生的事件(左/右按下或释放鼠标单击)
  • x:事件的x坐标
  • y:事件的y坐标
  • 标志:OpenCV传递的相关标志
  • 参数:OpenCV传递的额外参数
按下的左键单击记录左上角坐标,而松开的左键单击记录右下角坐标。然后,我们在ROI周围绘制一个边界框,并将左上角和右下角矩形区域的坐标打印到控制台。右键单击将重置图像

提取边界框坐标小部件:

import cv2

class BoundingBoxWidget(object):
    def __init__(self):
        self.original_image = cv2.imread('1.jpg')
        self.clone = self.original_image.copy()

        cv2.namedWindow('image')
        cv2.setMouseCallback('image', self.extract_coordinates)

        # Bounding box reference points
        self.image_coordinates = []

    def extract_coordinates(self, event, x, y, flags, parameters):
        # Record starting (x,y) coordinates on left mouse button click
        if event == cv2.EVENT_LBUTTONDOWN:
            self.image_coordinates = [(x,y)]

        # Record ending (x,y) coordintes on left mouse button release
        elif event == cv2.EVENT_LBUTTONUP:
            self.image_coordinates.append((x,y))
            print('top left: {}, bottom right: {}'.format(self.image_coordinates[0], self.image_coordinates[1]))
            print('x,y,w,h : ({}, {}, {}, {})'.format(self.image_coordinates[0][0], self.image_coordinates[0][1], self.image_coordinates[1][0] - self.image_coordinates[0][0], self.image_coordinates[1][1] - self.image_coordinates[0][1]))

            # Draw rectangle 
            cv2.rectangle(self.clone, self.image_coordinates[0], self.image_coordinates[1], (36,255,12), 2)
            cv2.imshow("image", self.clone) 

        # Clear drawing boxes on right mouse button click
        elif event == cv2.EVENT_RBUTTONDOWN:
            self.clone = self.original_image.copy()

    def show_image(self):
        return self.clone

if __name__ == '__main__':
    boundingbox_widget = BoundingBoxWidget()
    while True:
        cv2.imshow('image', boundingbox_widget.show_image())
        key = cv2.waitKey(1)

        # Close program with keyboard 'q'
        if key == ord('q'):
            cv2.destroyAllWindows()
            exit(1)

你好@Nathance。。。。我已经试过你的高质量图像代码,比如dpi>300。。。它不是在这些图像上绘制矩形框