Machine learning 机器学习-通过示例学习文件格式的软件

Machine learning 机器学习-通过示例学习文件格式的软件,machine-learning,file-format,Machine Learning,File Format,我的程序可以读取几十种文件格式,使用传统的方法为每种文件格式编写过程代码。这些格式中的大多数都有自己独特的加载程序库,有自己的bug,有自己的局限性,整个过程对我来说是一个巨大的时间接收器。我想支持大量其他格式,但它们大多不值得我花时间,因为它们不够流行 我想用一个由文件格式描述符驱动的加载程序来替换现有的加载程序。我敢肯定,有人创造了软件来学习文件格式的例子。我现有的加载程序将为这些格式生成优秀的适应度函数,我也可以为新格式编写适应度函数 我的问题是,我可以使用什么软件通过示例“学习”文件格式

我的程序可以读取几十种文件格式,使用传统的方法为每种文件格式编写过程代码。这些格式中的大多数都有自己独特的加载程序库,有自己的bug,有自己的局限性,整个过程对我来说是一个巨大的时间接收器。我想支持大量其他格式,但它们大多不值得我花时间,因为它们不够流行

我想用一个由文件格式描述符驱动的加载程序来替换现有的加载程序。我敢肯定,有人创造了软件来学习文件格式的例子。我现有的加载程序将为这些格式生成优秀的适应度函数,我也可以为新格式编写适应度函数


我的问题是,我可以使用什么软件通过示例“学习”文件格式,以及如何将“学习”转换为一个描述符,以便与通用加载程序一起使用?

除非您以一些大规模的方式对其进行限制,否则我认为您不会走得太远。这将是理想的,但超出了目前的技术水平。对于任意格式,您不能这样做,例如,如果我给您200个JPG、PNG、BMP和GIF,那么学习系统不太可能学习这些格式

以下是研究人员关注的一些问题:

  • 从示例学习正则表达式:看这个问题: , 比如说
  • 信息提取:我给你一个分类广告的列表 报纸,例如出租公寓。你需要提取 卧室数量、租金、押金和单位大小。 您可以在此处阅读更多信息:

所以机器无法通过示例学习所有可能的文件格式,但这不应该阻止我。如果格式有压缩这样的复杂性,我当然会提供一个解压缩功能。如果某些文件格式太复杂,我可以像以前一样编写加载程序。我认为大多数文件格式都不是学习算法无法达到的,我想尽我所能。