Performance Pytables时间性能
我正在做一个关于自然图像中文本检测的项目。我必须训练一个分类器,为此我使用Pytables来存储信息。我有:Performance Pytables时间性能,performance,pytables,Performance,Pytables,我正在做一个关于自然图像中文本检测的项目。我必须训练一个分类器,为此我使用Pytables来存储信息。我有: 62类(a-z、a-z、0-9) 每个班级有100到600张桌子 每个表有一个单独的列来存储32位浮点 每列有2^2到2^8行(取决于参数) 我的问题是,在训练分类器之后,在测试中读取信息需要花费很多时间。例如:一个数据库有27900个表(62个类*每个类450个表),每个表有4行,读取和检索我需要的所有信息大约需要4小时。测试程序读取每个表390次(对于A-Z类,A-Z类)和1
- 62类(a-z、a-z、0-9)
- 每个班级有100到600张桌子
- 每个表有一个单独的列来存储32位浮点
- 每列有2^2到2^8行(取决于参数) 我的问题是,在训练分类器之后,在测试中读取信息需要花费很多时间。例如:一个数据库有27900个表(62个类*每个类450个表),每个表有4行,读取和检索我需要的所有信息大约需要4小时。测试程序读取每个表390次(对于A-Z类,A-Z类)和150次(对于0-9类),以获得我需要的所有信息。这正常吗? 我尝试对unique列使用index选项,但没有看到任何性能。我在一台HP Pavilion Dv6(4GB Ram DDR3,Core2 Duo)上使用2GB Ram的虚拟机