跳到主要内容

刀片服务器无法通过 CPM 端口进行通信

如果刀片服务器无法通过铜缆 pass-thru 模块(CPM)进行通信,请验证 pass-thru 模块是否正常运行,刀片服务器中的扩展卡是否兼容,以及网络交换机设置是否与铜缆 pass-thru 模块上的设置匹配。

问题

刀片服务器无法通过 CPM 进行通信。

研究

铜缆 Pass-thru 模块(CPM)是仅支持千兆位的设备;无法与 10/100 交换机进行连接。所有刀片服务器到刀片服务器的连接都要求 CPM 连接到正确配置的外部交换机。外部交换机端口必须为千兆铜缆端口,并配置为自动协商。所有其他配置都不受支持,并将导致发生错误,从而表现为 CPM 无法正常工作。

CPM 不具有交换机功能,因此对 CPM 连接问题进行故障诊断时,您必须能够查看外部交换机的配置。此外,如果 I/O 托架 1 中存在 CPM,那么 Serial over LAN(SoL)也无法工作。

以下链路指示可用于确定连接问题:
  • 外部(上游)交换机可能会提供链路指示。它表示在层 1 链路的常规联网意义上,CPM 和上游交换机之间的链路正常。即使卸下 BladeCenter S 机箱中的所有刀片服务器,只要外部电缆正确连接,上游(外部)交换机链路指示灯就会点亮。
  • 高级管理模块提供内部和外部链路状态(从 CPM 角度)。如果外部链路表示为正常,就意味着连接的双方(外部交换机到 CPM 以及 CPM 到刀片服务器)已成功协商了速度和双工方式,以及从刀片服务器已为该连接检测到载波。如果未检测到任何内部信号,那么外部指示将不会提供指示(不会表明连接是否存在)。

    内部链路指示不表明速度和双工的成功协商。它仅告知您刀片服务器位于插槽中,并检测到部分电流。例如,如果您引导某台刀片服务器,使它进入 BIOS,然后禁用 NIC,即使速度和双工明显未成功协商,但链路仍显示为正常。(有一个例外是如果系统引导 Linux,并已卸下 NIC 驱动器模块,那么链路将显示为故障大约 15 分钟)。

    高级管理模块外部链路状态不同,从高级管理模块 Web 界面中查看的内部链路状态与外部链路无关,并在有/无外部连接时准确反映。链路正常表示以太网端口、以太网驱动程序、电缆以及上游端口和刀片服务器都已为 OSI 模型的层 1 正确配置。

  • 刀片服务器上的操作系统从以太网端口提供链路指示。
  • CPM 上的指示灯与高级管理模块可查看的外部链路状态相同。只有一个实际的 CPM 指示灯与每台刀片服务器连接相关。当该 CPM 链路指示灯点亮时,内部连接(CPM 到刀片服务器)和外部连接(CPM 到交换机)都识别电信号已连接。

任何端口上都没有连接

如果 BladeCenter S 机箱中的所有刀片服务器都无法通过 CPM 进行通信:
  1. 检查 CPM 的 POST 代码。解决找到的任何 POST 错误。
  2. 确保已通过高级管理模块 Web 界面为 CPM 启用了外部端口。
  3. 如果另一个以太网模块可以工作,请将此 CPM 与该以太网模块交换位置,以验证错误是出自模块还是出自 I/O 模块托架。如果错误出自 I/O 模块托架,请参阅以太网故障诊断文档。

某些端口上存在连接,但其他端口上没有连接

BladeCenter S 机箱中,所有刀片服务器以太网端口都连接到 I/O 模块托架 1。刀片服务器端口到 CPM 端口的映射如下所示:
  • 交换机端口 1 - 电缆 1A - 刀片服务器以太网端口 1A
  • 交换机端口 2 - 电缆 1B - 刀片服务器以太网端口 2A
  • 交换机端口 3 - 电缆 1C - 刀片服务器以太网端口 3A
  • 交换机端口 4 - 电缆 1D - 刀片服务器以太网端口 4A
  • 交换机端口 5 - 电缆 1E - 刀片服务器以太网端口 5A
  • 交换机端口 6 - 电缆 2A - 刀片服务器以太网端口 6A
  • 交换机端口 7 - 电缆 2B - 保留
  • 交换机端口 8 - 电缆 2C - 刀片服务器以太网端口 1B
  • 交换机端口 9 - 电缆 2D - 刀片服务器以太网端口 6B
  • 交换机端口 10 - 电缆 2E - 保留
  • 交换机端口 11 - 电缆 3A - 刀片服务器以太网端口 4B
  • 交换机端口 12 - 电缆 3B - 刀片服务器以太网端口 5B
  • 交换机端口 13 - 电缆 3C - 刀片服务器以太网端口 2B
  • 交换机端口 14 - 电缆 3D - 刀片服务器以太网端口 3B
  • 交换机端口 15 - 电缆 3E - 保留
如果 CPM 上的某些端口工作正常,但其他端口无法工作:
  1. 确保 CPM 电缆的方向正确。这些电缆不带有槽口,可能会反向连接。反向连接将导致某些端口上内部链路故障,而其他端口上链路正常。电缆以一定角度连接到金属电缆连接器。当电缆方向正确时,从金属连接器伸出的电缆方向向上
  2. 验证所有外部电缆是否都具备由上游(外部)交换机表明的链路。如果某些电缆不具备,请检查交换机配置,以确保上游交换机端口支持千兆位并已配置为自动协商。
  3. 检查上游交换机的统计信息,并验证链路当前运行的速度和方式。速度/双工结果应当为 1000/全双工。如果不一致,请为正常工作的端口和不工作的端口调换 RJ-45 接头,以确定是电缆问题还是上游端口问题。
  4. 如果上一步表明多头电缆有问题,请移开 CPM 上三个连接器间的电缆,以确定是电缆有问题还是连接器有问题。对表现为故障的组件进行更换。
  5. 验证刀片服务器以太网端口是否已在操作系统中正确配置,并显示链路正常。请牢记,看到内部链路正常并不一定表示以太网端口具有正确的层 1 链路。
  6. 更换 CPM。