Linux 端口状态始终为关闭,无法打开UMAD端口

Linux 端口状态始终为关闭,无法打开UMAD端口,linux,suse,infiniband,Linux,Suse,Infiniband,我在以下机器上新安装了ofed-1.5-3: SUSE Linux企业服务器11(x86_64) 版本=11 补丁级别=1 我们的管理员已在机器上安装了CX354A卡(MCX354A-FCBT)卡。 $lspci | grep-i mel 04:00.0网络控制器:Mellanox Technologies设备1003 (问题1:我不知道lspci的输出是否正确,我怀疑 虽然是这样,但我不知道如何获得正确的输出。) 通过./mlnxhofedinstall脚本安装ofed包后: ofed|U信息

我在以下机器上新安装了ofed-1.5-3:

SUSE Linux企业服务器11(x86_64) 版本=11 补丁级别=1

我们的管理员已在机器上安装了CX354A卡(MCX354A-FCBT)卡。 $lspci | grep-i mel 04:00.0网络控制器:Mellanox Technologies设备1003

(问题1:我不知道lspci的输出是否正确,我怀疑 虽然是这样,但我不知道如何获得正确的输出。)

通过./mlnxhofedinstall脚本安装ofed包后:

ofed|U信息头-1的输出: MLNX_OFED_LINUX-1.5.3-3.1.0(OFED-1.5.3-3.1.0):

安装成功,openibd加载了所有必需的 模块/驱动程序。 $service openibd状态

已加载HCA驱动程序

配置的IPoIB设备: ib0 ib1

当前活动的IPoIB设备:

加载以下OFED模块:

rdma_ucm ib_srp rdma_cm 伊布地址 ib_ipoib mlx4_磁芯 mlx4_ib mlx4_en ib_mthca 伊布乌韦布斯酒店 伊布乌马德 ib_ucm 伊布萨 伊布厘米 伊布疯了 ibu核 iw_cxgb3 iw_nes

hca_self_test.ofed的输出

----执行适配器设备自检---- 检测到的CA数。。。。。。。。。。。。。。。。。1. PCI设备检查。。。。。。。。。。。。。。。。。。。。。。。通过 仁拱。。。。。。。。。。。。。。。。。。。。。。。。。。。。x86_64 主机驱动程序版本。。。。。。。。。。。。。。。。。。。。MLNX_OFED_LINUX-1.5.3-3.1.0 (OFED-1.5.3-3.1.0):2.6.32.12-0.7-默认值 主机驱动程序RPM检查。。。。。。。。。。。。。。。。。。通过 CA#0 VPI上的固件。。。。。。。。。。。。。。。。。。v2.10.700 CA#0(VPI)上的固件检查。。。。。。。。。。NA 原因:不需要fw版本 主机驱动程序初始化。。。。。。。。。。。。。通过 活动的CA端口数。。。。。。。。。。。。。。0 CA 0(VPI)上端口1的端口状态。。。。。向下(InfiniBand) CA 0(VPI)上端口2的端口状态。。。。。向下(InfiniBand) CA#0(VPI)上的错误计数器检查。。。。。。通过 内核系统日志检查。。。。。。。。。。。。。。。。。。。。通过 CA#0(VPI)上的节点GUID。。。。。。。。。。。。。。。00:02:c9:03:00:f9:ed:e0 ------------------完成---------------------

问题2:现在,当我尝试ibstatus或ibv_devinfo时,我看到端口状态为 左舷向下。我在文档中读到的是,它应该处于INIT状态。我的问题 是如何让它进入初始状态的。 $ibv_devinfo

hca_id:mlx4_0 传输:InfiniBand(0) 固件版本:2.10.700 节点guid:0002:c903:00f9:ede0 系统映像guid:0002:c903:00f9:ede3 供应商标识:0x02c9 供应商零件号:4099 硬件版本:0x0 董事会编号:MT_1090120019 物理端口:2 港口:1 状态:端口关闭(1) 最大mtu:2048(4) 有效mtu:2048(4) sm_lid:0 端口盖:0 端口号:0x00 链路层:IB

            port:   2
                    state:                  PORT_DOWN (1)
                    max_mtu:                2048 (4)
                    active_mtu:             2048 (4)
                    sm_lid:                 0
                    port_lid:               0
                    port_lmc:               0x00
                    link_layer:             IB
当我尝试执行以下命令时,出现错误:

$ibportstate-G 0x0002c90300f9ede0 1查询/启用/禁用 ibwarn:[9318]mad_rpc_open_端口:无法打开UMAD端口((null):0) ibportstate:iberror:失败:无法打开“(null)”端口“0”

问题3:我不明白为什么我会犯这个错误,或者我该如何摆脱它。有什么帮助吗 非常感谢

如果你需要更多信息,请告诉我


谢谢

在您使用infiniband电缆将此节点连接到另一个节点或infiniband交换机之前,ibv_devinfo中的端口状态将处于关闭状态。从模块上看,您似乎已经完成了所有必要的设置,只是缺少了另一个可以对话的节点。一旦您将其连接到另一个节点,您应该能够看到状态更改为PORT_INIT并填充链接速度等。

ibv_devinfo中的端口状态将关闭,直到您使用infiniband电缆将此节点连接到另一个节点或infiniband交换机。从模块上看,您似乎已经完成了所有必要的设置,只是缺少了另一个可以对话的节点。一旦您将其连接到另一个节点,您应该能够看到状态更改为PORT_INIT并填充链接速度等。

旧问题,但以防万一有人关心。。。你是以root的身份做这件事的吗?尝试从普通用户帐户查询或设置infiniband状态将导致“无法打开UMAD端口”错误。旧问题,但以防有人关心。。。你是以root的身份做这件事的吗?尝试从常规用户帐户查询或设置infiniband状态将导致“无法打开UMAD端口”错误。