Artificial intelligence 如何在边缘实现安全关键的AI计算集群?

Artificial intelligence 如何在边缘实现安全关键的AI计算集群?,artificial-intelligence,failover,redundancy,nvidia-jetson,safety-critical,Artificial Intelligence,Failover,Redundancy,Nvidia Jetson,Safety Critical,我想尝试开发一个冗余的自动汽车计算架构,它可以处理所有人工智能和其他计算内容。为此,我买了一些边缘计算设备(Nvidia Jetson TX2s),其中包含集成GPU。然后我用一个千兆以太网交换机连接它们,这样现在我就可以和它们通信了 我需要你对系统架构的建议。如何实现这种故障保护、安全标准和冗余系统?有一些集群示例提供了高可用性。但我想这样做:“每个计算节点运行相同的进程,然后将结果输出到主节点。主节点分析并投票结果,然后选择最佳结果。如果一个计算节点出现故障(错误、系统故障、缺少电能等),系

我想尝试开发一个冗余的自动汽车计算架构,它可以处理所有人工智能和其他计算内容。为此,我买了一些边缘计算设备(Nvidia Jetson TX2s),其中包含集成GPU。然后我用一个千兆以太网交换机连接它们,这样现在我就可以和它们通信了

我需要你对系统架构的建议。如何实现这种故障保护、安全标准和冗余系统?有一些集群示例提供了高可用性。但我想这样做:“每个计算节点运行相同的进程,然后将结果输出到主节点。主节点分析并投票结果,然后选择最佳结果。如果一个计算节点出现故障(错误、系统故障、缺少电能等),系统应意识到故障,并将故障节点的计算负载转移到健康节点。此外,每个节点应在不受协作进程影响的情况下运行某些特定于节点的任务。”


你的想法是什么?任何关键字、建议、方法推荐都对我有帮助。

汽车的主要系统/软件安全标准是。如果你打算认真地制作一款汽车产品,你会想要得到一份拷贝,并遵循这个过程

汽车自主性等级的主要分类是。如果事先知道要射击哪个级别,你会省去很多头痛。在尝试做更复杂的事情之前,你可能想尝试1级(“动手操作”),比如自适应巡航控制或车道偏离预防系统

以下是我从安全工作中收集到的一些一般主题:

  • 没有公认的方法来确定软件故障的概率。甚至有一个学派认为。相反,大多数安全标准将软件中实现的安全重要功能指定给不同的“级别”,需要基于某些标准进行更高级别的审查,包括严重性、接近危险(是否存在联锁?)等
  • 大多数安全标准将软件定义为在硬件上运行的一切,因此您需要确保您使用的操作系统也能满足标准。这通常意味着一个实时操作系统
  • 让您的安全重要功能尽可能简单。如果你能用基本电路和逻辑门(比如紧急停止)做些什么,那就做吧,因为数学和分析对于硬件来说要成熟得多
  • 获取并遵守安全相关编码标准。汽车应用中最主要的一种是
  • 研究使用,以确定事故发生所需的故障关系。这也有助于识别单点故障
  • 尽可能减轻设计中的危险。程序缓解措施和个人防护设备应是最后手段
  • 至少,你需要一个安全驾驶员的硬电急停装置和一个由观察员操作的遥控急停装置

我想到了有助于飞机运行的系统,所以你可能想从那里开始。事实上,这个问题过于宽泛和/或基于观点。