3d 三维摄像机位置和孔径角的ML图像分析

3d 三维摄像机位置和孔径角的ML图像分析,3d,3d,我想在我的网络项目中添加一个ML图像分析,人们上传一个包含字母的图像,应用程序识别字母并提取3D相机位置和光圈角度。我自己也不是一个真正的程序员,虽然我对功能规划等方面的知识非常了解,但我想选择一条路径来介绍它,并与编码人员合作来完成它 关于如何正确完成这项任务的任何提示(敬请谅解) Frank如果你要自己训练ML algo(我猜你需要),你需要: 要检测的任何标志符号的大型数据集 具有图像处理管道知识的人,用于扩充数据。仅仅是字形的数据是不够的,你需要把每个字形放在不同光圈和不同位置的随机组

我想在我的网络项目中添加一个ML图像分析,人们上传一个包含字母的图像,应用程序识别字母并提取3D相机位置和光圈角度。我自己也不是一个真正的程序员,虽然我对功能规划等方面的知识非常了解,但我想选择一条路径来介绍它,并与编码人员合作来完成它

关于如何正确完成这项任务的任何提示(敬请谅解)


Frank

如果你要自己训练ML algo(我猜你需要),你需要:

  • 要检测的任何标志符号的大型数据集
  • 具有图像处理管道知识的人,用于扩充数据。仅仅是字形的数据是不够的,你需要把每个字形放在不同光圈和不同位置的随机组合中
  • 你需要训练神经网络,对字形进行一个热编码(每个字形一个输出神经元),然后可能对旋转、角度等各训练一到两个神经元
这并不容易,谷歌、亚马逊等公司已经花费了数百万美元和数百万小时来开发这样的计算机视觉技术,并且需要花费大量的时间来开发和培训。真正问问自己,这个特性和所有这些组件对你来说是否都是必要的


您还可以使用它,使ML算法只需要检测轮廓,并使用某种形式的其他计算机视觉/图像操纵技术(opencv)将图像操纵回轮廓,并基于这些变换对原始相机位置进行假设。本质上,看看需要做些什么来获取识别的标志符号并将其转换为应用程序提供的数据。但即使这样,您也需要一个未转换版本的已识别标志符号,它才能正常工作。

ok i c。然后,我可能最好选择一个非百万美元路径,这将是3D在网络中的使用。 用户只需在照片中标出一个正方形的周长,然后我就可以计算场景范围和摄像头位置

问题,是否有一个开放源码的服务器端3D应用程序允许php交互


保留地说,将这个话题设置为任务的好方法是什么?

@Frank如果你喜欢,请将它标记为答案(我甚至不能对你的帖子发表评论,但我的代表太少了)