Optimization 使用Logistic回归模型自动选择gcc编译器优化

Optimization 使用Logistic回归模型自动选择gcc编译器优化,optimization,gcc,compiler-construction,automation,machine-learning,Optimization,Gcc,Compiler Construction,Automation,Machine Learning,我正在做一个基于gcc编译器优化选项选择的项目,使用基于本文的名为LRM(逻辑回归模型)的算法 在该算法中,第一步是通过编译和执行每个组合的程序,从所有可用的优化选项组合(现在大约65个)中创建一个训练数据。然后稍后使用这些数据更快地为其他代码找到最佳的优化选项集 谁能帮我理解我该如何存储这些数据。我计划创建一个2D数组,然后将数组存储在一个二进制文件中。有更好的方法吗?请帮忙。我如何继续使用LRM从训练数据中找到最佳集合。欢迎提出任何建议 谢谢。这是一个2D数组,每个选项一列,结果一列(标准测

我正在做一个基于gcc编译器优化选项选择的项目,使用基于本文的名为LRM(逻辑回归模型)的算法

在该算法中,第一步是通过编译和执行每个组合的程序,从所有可用的优化选项组合(现在大约65个)中创建一个训练数据。然后稍后使用这些数据更快地为其他代码找到最佳的优化选项集

谁能帮我理解我该如何存储这些数据。我计划创建一个2D数组,然后将数组存储在一个二进制文件中。有更好的方法吗?请帮忙。我如何继续使用LRM从训练数据中找到最佳集合。欢迎提出任何建议


谢谢。

这是一个2D数组,每个选项一列,结果一列(标准测试用例的运行时)。由于共有65列,选项为开或关,因此有2^65种可能的组合,即36893488147419103232。按结果列排序,这就是最佳选项集

我想我应该使用CSV文件

可能的组合数量是不切实际的。测试以确定是否有任何单个标志使您的程序更快或更慢,然后如果任意两个标志组合的工作效果优于它们各自改进的总和(协同效应),则对三个标志执行相同的操作,依此类推。然后可在这些协同组中使用这些选项,以减少可能的组合数量


但这是一个荒谬的选择组合大量

它是一个2D数组,每个选项一列,结果一列(标准测试用例的运行时)。由于共有65列,选项为开或关,因此有2^65种可能的组合,即36893488147419103232。按结果列排序,这就是最佳选项集

我想我应该使用CSV文件

可能的组合数量是不切实际的。测试以确定是否有任何单个标志使您的程序更快或更慢,然后如果任意两个标志组合的工作效果优于它们各自改进的总和(协同效应),则对三个标志执行相同的操作,依此类推。然后可在这些协同组中使用这些选项,以减少可能的组合数量


但这是一个荒谬的选择组合大量

我非常清楚创建培训数据所需的时间将是一个漫长的过程。。Thnx.而且我非常清楚创建训练数据所需的时间将是一个很长的过程。。Thnx。