Linux   发布时间:2022-04-01  发布网站:大佬教程  code.js-code.com
大佬教程收集整理的这篇文章主要介绍了linux – 几台服务器上dmesg中的硬盘驱动器问题相同大佬教程大佬觉得挺不错的,现在分享给大家,也给大家做个参考。

概述

我们有几个 these SuperMicro MicroCloud units. 我们总共有16个服务器(2×8),它们都在dmesg中随机地发出这些消息: [4661350.802707] ata2.00: failed command: WRITE FPDMA QUEUED [4661350.802734] ata2.00: cmd 61/00:28:00:d0:fc/04:00:0f:00:
我们有几个 these SuperMicro MicroCloud units.

我们总共有16个服务器(2×8),它们都在dmesg中随机地发出这些消息:

[4661350.802707] ata2.00: Failed command: WRITE FPDMA QUEUED
[4661350.802734] ata2.00: cmd 61/00:28:00:d0:fc/04:00:0f:00:00/40 tag 5 ncq 524288 out
[4661350.802735]          res 40/00:0c:00:f8:fc/00:00:0f:00:00/40 Emask 0x10 (ATA bus error)
[4661350.802821] ata2.00: status: { DRDY }

即使由于错误,一切似乎都很好,但忽略它们感觉非常错误.它主要发生在磁盘活动较多的时期.

在一台服务器上,即使在高磁盘活动期间,它也会随机停止.

谷歌搜索表明它可能是由于连接器松动或驱动器故障,但它发生在16个不同类型硬盘驱动器的不同服务器上(8个使用7200转WD黑色SATA驱动器,另外8个使用10000 RPM VeLociRaptors).

我们尝试了两个不同的Linux内核,2.6.32(Debian SqueezE)和3.2.44(Debian Wheezy).

服务器供应商建议升级到最新的BIOS,但我们已经在运行它.

所以现在我们被卡住了:)有人有建议吗?

完整的dmesg:http://pastebin.com/Z9k1kXbc

更新:Jim Garrison指向AskUbuntu Question,他们提到有缺陷的英特尔芯片组.我现在担心我们受此影响了,然它已经在2011年被发现了.(服务器是在2012年第四季度建造的,但SuperMicro可能在2011年有一个旧批次 – 他们制造自己的主板).

“lspci”给了我这个:

00:00.0 Host bridge: Intel Corporation SAndy Bridge DMI2 (rev 07)
00:1f.2 SATA controller: Intel Corporation Patsburg 6-Port SATA AHCI Controller (rev 06)

A softpedia news article提到“rev04”受到影响.我应该从lspci的“rev 07”中收集到我们不受影响吗?

Intel errata from June 2013提到了一些类似的问题:

解决方法

它对我来说当然看起来像一个控制器问题.希望你有一些保修.这是一个总线错误,而不是一个没有响应的驱动器,通常是有缺陷的驱动器控制器板和边缘电缆(或背板)的情况;它看起来像是系统板.

您也可以尝试刷新BIOS(即使使用相@R_941_11197@)以排除某种类型的BIOS损坏.

我相信这样的结果只是重置并继续,所以你可能没有什么可担心的,尽管它会对性能产生负面影响.它也可能随着时间的推移而恶化.

大佬总结

以上是大佬教程为你收集整理的linux – 几台服务器上dmesg中的硬盘驱动器问题相同全部内容,希望文章能够帮你解决linux – 几台服务器上dmesg中的硬盘驱动器问题相同所遇到的程序开发问题。

如果觉得大佬教程网站内容还不错,欢迎将大佬教程推荐给程序员好友。

本图文内容来源于网友网络收集整理提供,作为学习参考使用,版权属于原作者。
如您有任何意见或建议可联系处理。小编QQ:384754419,请注明来意。