Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/linux/23.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Linux 高度并发的多线程应用程序需要硬件_Linux_Hardware_Smp_Parallel Processing_Flops - Fatal编程技术网

Linux 高度并发的多线程应用程序需要硬件

Linux 高度并发的多线程应用程序需要硬件,linux,hardware,smp,parallel-processing,flops,Linux,Hardware,Smp,Parallel Processing,Flops,我正在寻找一个硬件,它必须在24小时模式下运行大约256个计算密集型实时并发任务(一个多线程C应用程序)。每项任务需要大约40-50兆次循环,因此所有任务都需要大约10兆次循环。CPU-RAM速度微不足道。所有任务都必须由Linux内核(32位,带SMP)管理 我正在寻找一个单主板解决方案与一个多核心CPU(如果这样的CPU存在)。如果这样的CPU不存在,那么我需要一个多插槽主板解决方案(带有多个CPU) 你能给我推荐任何专业的CPU/主板解决方案来满足这些要求吗?Linux内核(2.6.25)

我正在寻找一个硬件,它必须在24小时模式下运行大约256个计算密集型实时并发任务(一个多线程C应用程序)。每项任务需要大约40-50兆次循环,因此所有任务都需要大约10兆次循环。CPU-RAM速度微不足道。所有任务都必须由Linux内核(32位,带SMP)管理

我正在寻找一个单主板解决方案与一个多核心CPU(如果这样的CPU存在)。如果这样的CPU不存在,那么我需要一个多插槽主板解决方案(带有多个CPU)

你能给我推荐任何专业的CPU/主板解决方案来满足这些要求吗?Linux内核(2.6.25)没有问题也是非常重要的。无需虚拟化,无需庞大的RAM或CPU缓存。我也更喜欢英特尔体系结构和久经考验的稳定性。我仍然怀疑它是否可行

先谢谢你

更新: 我想我已经找到了一个正确的答案

  • 租用一些AmazonEC2节点

  • 更新:那么PS3呢?美国宇航局将其用于模拟引擎

  • 也许在商用服务器中使用CPU+GPU

  • 构建它:现在,一些变体包括可以运行Linux的处理器

  • 租用一些AmazonEC2节点

  • 更新:那么PS3呢?美国宇航局将其用于模拟引擎

  • 也许在商用服务器中使用CPU+GPU

  • 构建它:现在,一些变体包括可以运行Linux的处理器


  • 获取一组四核或八核机器,并使用某种网格或集群软件在机器之间分割处理。也许你可以看看


    正如你所提到的,10Gblops并不值得一提,所以在一台机器上,它会很昂贵。还有一个问题是,当机器坏了,你怎么办?你不太可能有第二台类似规格的机器。如果您使用商品硬件构建集群,那么您的弹性会更强一些,并且更容易找到替换机器。

    获取一组四核或八核机器,并使用某种网格或集群软件在机器之间分割处理。也许你可以看看


    正如你所提到的,10Gblops并不值得一提,所以在一台机器上,它会很昂贵。还有一个问题是,当机器坏了,你怎么办?你不太可能有第二台类似规格的机器。如果您使用商品硬件构建集群,您的弹性会更强,而且更容易找到替换机器。

    不是英特尔体系结构,而是运行linux,在一个芯片上有64个内核


    不是英特尔体系结构,而是运行linux,在单个芯片上有64个内核


    即使您已经为我们提供了您认为需要的规格,如果您告诉我们应用程序的目的是什么,以及它是如何实现的,我们可能会更好地帮助您


    可能有更好的方法来分解或处理工作,而不是您当前的解决方案。

    即使您已经为我们提供了您认为需要的规格,如果您告诉我们应用程序的目标和实现方式,我们可能会更好地帮助您

    可能有更好的方法来分割或处理工作,而不是使用当前的解决方案。

    有8个内核,每个内核有8个线程。集成高带宽内存和IO。其中两个用于128个硬件线程

    8个浮点单元的理论最大原始性能为每秒11千兆次(GFlops/s)。然而,与其他实现相比,一个巨大的优势是64个线程可以共享单元,因此我们可以实现非常高的理论峰值百分比。我们的实验已达到11 Gflop/s的近90%。-()

    有8个内核,每个内核有8个线程。集成高带宽内存和IO。其中两个用于128个硬件线程

    8个浮点单元的理论最大原始性能为每秒11千兆次(GFlops/s)。然而,与其他实现相比,一个巨大的优势是64个线程可以共享单元,因此我们可以实现非常高的理论峰值百分比。我们的实验已达到11 Gflop/s的近90%。-()


    我知道你更喜欢英特尔,但如果你需要一个芯片,我会再次建议使用cell处理器- 它的理论峰值性能大约为25GFlops——内核2.6.25已经支持它了

    您可以尝试使用一款超薄的playstation 3进行试验(成本很低),或者以大约8K美元的价格购买一款基于服务器的解决方案——您需要重新编写和微调线程,以获得SPU协处理器的优势,但您可以在不费吹灰之力的情况下实现您的计算需求(1个PPC芯+8个SPU)

    注:使用playstation 3,您只有6个可用的协处理器-但您没有看到在这个项目上有预算- 所以你至少可以试试IBM的cell developer kit,它提供了一个模拟器,看看你是否可以编写你的解决方案在上面运行

    Thre是商用手机产品,既可以作为刀片式工厂的独立服务器,也可以作为PC工作站的PCI Express附加板 Mercury计算机系统:

    Mercury没有在网站上列出任何价格,但这些PCI Express卡的价格似乎在之前提到的8000.00美元左右

    一款playstation 3视频游戏可以花300美元左右购买,这样你就可以制作你的应用程序原型,并检查它是否达到所需的性能。(我自己也买了一款,并在上面运行Fedora 9,尽管我是作为一个哈比人这样做的,到目前为止,还没有将它用于任何计算,但我也把它放在一起了。)