Statistics 给定事件序列的测量值作为输入,如何生成具有相同配置文件的无限输入序列?

Statistics 给定事件序列的测量值作为输入,如何生成具有相同配置文件的无限输入序列?,statistics,scheduling,simulation,montecarlo,markov-chains,Statistics,Scheduling,Simulation,Montecarlo,Markov Chains,我目前正在使用一个系统,该系统根据一系列请求和系统状态做出调度决策 我想获取真实输入流,模拟一些组件,并对其余部分进行模拟。其思想是使用它来规划系统容量(即何时扩展某些组件),跟踪某些故障模式,并分析代码库更改的影响(即使用版本A的模拟与使用版本B的模拟进行比较) 除了生成合适的输入流之外,我可以做与此相关的所有事情。重放生产中的精确输入并没有多大帮助,因为很难获得足够长的数据流来梳理出我试图找到的一些行为。换言之,如果生产在投入300天后就结束了,我就没有足够的数据去发现,直到它结束之后。已考

我目前正在使用一个系统,该系统根据一系列请求和系统状态做出调度决策

我想获取真实输入流,模拟一些组件,并对其余部分进行模拟。其思想是使用它来规划系统容量(即何时扩展某些组件),跟踪某些故障模式,并分析代码库更改的影响(即使用版本A的模拟与使用版本B的模拟进行比较)

除了生成合适的输入流之外,我可以做与此相关的所有事情。重放生产中的精确输入并没有多大帮助,因为很难获得足够长的数据流来梳理出我试图找到的一些行为。换言之,如果生产在投入300天后就结束了,我就没有足够的数据去发现,直到它结束之后。已考虑重复相同的输入集;但经过几次初步尝试,开发人员都同意模拟似乎“需要更多的随机性”

关于此特定系统:

  • 输入是一系列不规则间隔的事件(即具有离散时间和连续状态空间的随机过程)
  • 属性之间不是相互关联的
  • 更独立于属性的是其他属性的复合物,这些属性在本质上对我来说永远是看不见的(这导致了一个错误)
  • 请求间隔不独立于其他属性(即,对少量资源的大量请求在一个批处理中完成,而对大型请求则不会)
  • 它有反馈回路
  • 这是可以证明的混乱
因此:

给定一个具有各种属性(包括间隔)特定分布的输入事件流,如何生成一个无限的事件流,这些事件流在许多非独立属性上具有相同的分布


环顾四周,我想我需要做一个马尔可夫链蒙特卡罗模拟。我的问题是如何从现有的输入数据中构建马尔可夫链。

也许可以使用。有一些工具可以帮助您这样做,例如,请参阅。除此之外,我建议将问题转移到,因为这是一个统计问题,可能会引起更多的注意