Re: RAID構築後のsmartdのエラー ( No.1 ) |
|
- ????????? 2007/02/03 12:48
- ????????? 管理者
-
当方でも先程「smartd」を起動してみました。
現状では起動ログしかありませんが、後日「logwatch」を確認してみたいと思います。
ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。 これはRAIDカードのスペックに依存するようです。 以前、「ATA133RAID-PCI2」は全く取得できませんでしたが現行の「Serial ATA RAID 1210SA」ではある程度取得できています。
|
Re: RAID構築後のsmartdのエラー ( No.2 ) |
|
- ????????? 2007/02/03 20:58
- ????????? セブン
-
管理者さん、
わざわざ僕の質問の回答のためにSmartdをご自身のPC上で再起動してくださったのですね、 本当にありがたいサイトだと思っております。サイト管理者が現場で悩んでいる人と同じ視点で 疑問に答えようと勤めて下さっている。このような僕がこんな風に書いてよいかわかりませんが、 管理者さんのお人柄がこのサイトの最大の魅力だと思っております。 普通でしたら「お使いのRAIDだったら、Smartdを止めた方がいいですよ」なんて 回答でかたずけてよいはずなのに、ここはそうではありません。 僕もいろんな組織を見てきましたが、成功の鍵は中心者の一念心、その人ががどれだけ現場で 奔走しているかのようです。 このサイトは必ずやこれからも発展していくと確信しています。 本当にありがとうございます。
ところで、以下の言い回しがわかりません。もう少しSmartdを勉強してみようとおもいます。
> ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。
|
Re: RAID構築後のsmartdのエラー ( No.3 ) |
|
- ????????? 2007/02/04 09:47
- ????????? 管理者
-
セブンさん
> わざわざ僕の質問の回答のためにSmartdをご自身のPC上で再起動してくださったのですね
ご回答できる部分と不可能である部分によって、当方にて検証できるかによります。 例えば今回のH/W関連に依存する場合、同様の機器構成であれば問題ありませんがセブンさんの場合は RAIDが間に絡んでいますよね。 同様の構成でないと事象が異なるケースも発生してしまいます。この場合新たにRAIDを購入して・・・ という訳にはならないので回答が難しいのが現状です。 しかし、型番こそ違いますが当方も構成としては同じです。明確な回答はできないかも知れませんが 解決への糸口へなればと存じます。
P.S. 色々と激励のお言葉、ありがとうございます。発展するかは未知ですが今後も頑張らせて頂きます。
============================
さて、本題ですが「logwatch」の結果をご報告いたします。 smartdの仕組みはわかりませんがログには何も出力されませんでした。(smartd)セクションもありません。
ちなみに昨日「smartd」を起動した時のシスログが以下になります。
Feb 3 12:44:25 fedora smartd[15234]: smartd version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Feb 3 12:44:25 fedora smartd[15234]: Home page is http://smartmontools.sourceforge.net/ Feb 3 12:44:25 fedora smartd[15234]: Opened configuration file /etc/smartd.conf Feb 3 12:44:25 fedora smartd[15234]: Configuration file /etc/smartd.conf parsed. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, opened Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, found in smartd database. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, is SMART capable. Adding to "monitor" list. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sdb, opened Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sdb, found in smartd database. Feb 3 12:44:26 fedora smartd[15234]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list. Feb 3 12:44:26 fedora smartd[15234]: Monitoring 2 ATA and 0 SCSI devices Feb 3 12:44:26 fedora smartd[15237]: smartd has fork()ed into background mode. New PID=15237.
気になった点が・・・・(以下引用) > ちなみに/etc/smartd.confファイルの30行目のコードは以下の通りです。 > > # A very silent check. Only report SMART health status if it fails > # But send an email in this case > /dev/hda -H -m root > > それと、以下のコマンド(smartctl)を実行してみました。 > その答えの一つとして、SMARTはATA Versionの3以上でのみ有効とあり、 > 使用しているHDのATA Versionは1となっていました。これが原因なんでしょうか? > もしそうであれば、何故いままで文句を言ってこなかったのでしょうか??? > > [root@websrv etc]# smartctl --all /dev/hda
デバイス名が「hda」の「h」になっていますが、「s」ではないですよね? RAID接続すると、大抵はSCSIとみなされ「sda」となるようです。
>> ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。
言葉の表現と説明不足でした。すみません。 上記の様にデバイス名が変わってしまう問題や「S.M.A.R.T」で取得できる項目(例としてHD温度) が取得できたり出来なかったりします。 コマンド実行毎にできたりできなかったり・・と言う意味ではありません。 RAID-CARDがHDとの通信に対応しているか否かと言うことです。
後、「smartctl」コマンドですが「ATAだよ」と教えないと当方の場合は何も答えてくれませんでした。
【通常(一般的なコマンド)】
# smartctl --all /dev/sda smartctl version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Device: ATA HDS722512VLSA80 Version: V33O
In Linux, SATA disks accessed via libata are only supported by smartmontools for kernel versions 2.6.15 and above. Try an additional '-d ata' argument.
【「-d ata」を付加したコマンド】 # smartctl -d ata --all /dev/sda smartctl version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION === Model Family: Hitachi Deskstar 7K250 series Device Model: HDS722512VLSA80 Serial Number: VN6C3ECCDBM86D Firmware Version: V33OA63A User Capacity: 123,521,334,784 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 6 ATA Standard is: ATA/ATAPI-6 T13 1410D revision 3a Local Time is: Sun Feb 4 08:54:26 2007 JST SMART support is: Available - device has SMART capability. SMART support is: Enabled : : : SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t]
Device does not support Selective Self Tests/Logging
よって、「smartd.conf」の設定は、以下の様になっています。
# A very silent check. Only report SMART health status if it fails # But send an email in this case /dev/sda -d ata -H -m root /dev/sdb -d ata -H -m root
現状では、ここまでしか情報共有できませんが引き続き模索してみたいと思います。
|
Re: RAID構築後のsmartdのエラー ( No.4 ) |
|
- ????????? 2007/02/05 14:56
- ????????? セブン
-
管理者さん、
ご親切なご返答、とても感謝しております。 また返事が遅れてしまい大変に申し訳ありません。
一つ御報告なんですが、最新のLogwatchの出力にSmartdの内容が消えていました。 何の変更も加えていないのに、理由はまったく分かりません。 また、管理者さん御指摘のようにHWの構成の違いからなのでしょうか、僕の環境下ですと いくつかの相違点があるようです。
1.RAID環境下でも/dev/sdaではなく/dev/hdaとして認識しているようです。 /dev/sda というデバイスファイルは存在してないみたいです。
[root@websrv ~]# smartctl -d ata --all /dev/sda smartctl version 5.36 [i686-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Smartctl open device: /dev/sda failed: No such file or directory
[root@websrv ~]# ls -lt /dev/sd* ls: /dev/sd*: No such file or directory [root@websrv ~]# [root@websrv ~]# ls -lt /dev/hd* brw-r----- 1 root disk 3, 1 Feb 4 10:55 /dev/hda1 brw-rw---- 1 root disk 22, 0 Feb 4 10:55 /dev/hdc brw-rw---- 1 root disk 22, 64 Feb 4 10:55 /dev/hdd brw-r----- 1 root disk 3, 0 Feb 4 02:55 /dev/hda brw-r----- 1 root disk 3, 2 Feb 4 02:55 /dev/hda2
2. '-d ata'オプションを付けても付けなくても出力に変化はありませんでした。 '-d' オプションを処理する以前にエラーが出ているためかもしれませんね。
とにかく、LogwatchにSmartdの警告メッセージが消えてしまったこと、不思議です。 果たしてRAIDコントローラーはS.M.A.R.TというHDの自己診断機能の助けを得て HDDの不良解析をしているのかどうか?僕にとって大きな関心事ですね。 もし使っているのであればsmartctlコマンド実行時の警告メッセージやSmartd のLogwatch上に出力されたメッセージが気になります。 もしRAID-CはS.M.A.R.Tと連帯していないのであれば、今回の症状は無視しても よいのかなと思っておりますが。 いずれにしましても、僕自身のHDD,RAIDに関する知識不足を痛感しております。 今後とも監視を継続していこうと思っております。
引き続き、もしご意見等ある方、ご一報いただければありがたいと思っております。 宜しくお願いいたします。
|
Re: RAID構築後のsmartdのエラー ( No.5 ) |
|
- ????????? 2007/02/05 18:01
- ????????? やすお
-
管理者さんも書かれておりますが、ATA133RAID-PCI2を仲介するとSMART情報が正しく取得できないようです。
僕の場合も、直接HDをマザーに取り付けた時のSMART情報と、ATA133RAID-PCI2に取り付けた時ではSMART情報が全く異なる(ほとんど取得できません)
smartdが使用するハード情報DBには、大抵のHDの情報があるみたいですがRAIDカードを通すと命令がHDまで届かないORHDから結果が返却されない等があるみたいです。
後、予断ですけど僕の場合RAID1にすると /dev/hdc のように1台としてしか認識されません。(hda hdbは何処へ??)
管理者さんが sda と仰っているのはお持ちのHDがS−ATAなのでSCSIと認識されると言いたいのだと思います。 セブンさんはATAなので hdx と置き換えてお読みになられた方が宜しいかと思います(困惑されていたらですが・・・・)
|
Re: RAID構築後のsmartdのエラー ( No.6 ) |
|
- ????????? 2007/02/06 01:08
- ????????? house
-
私も、ATA133RAID-PCI2
ではエラーになっていました。 これは、CentOS4.2のときと FC5、FC6 いずれでもエラーがあったように思います。
マザーにもともと付いている なんちゃってRAID(S-ATA)なんかは 結構いけるものが多いように思います。
|
Re: RAID構築後のsmartdのエラー ( No.7 ) |
|
- ????????? 2007/02/06 13:34
- ????????? セブン
-
やすおさん、Houseさん、返信ありがとうございます。
ところでお二人は現在もATA133RAID-PCI2をお使いになってるのでしょうか? またこの症状はATA133RAID-PCI2に限らず、他のRAIDでも報告されている問題なのか興味のあるところです。 RAID-CはHDからのS.M.A.R.T情報を取得できないなかで、なにか独自の手法で不良検出をしているのだろうか??? なんか怪しい気がしてきています。
|
Re: RAID構築後のsmartdのエラー ( No.8 ) |
|
- ????????? 2007/02/07 02:10
- ????????? ももんが
-
セブン さん
smartdですが、起動時にエラーが出ていたのでサービスコマンドで止めちゃいました。 (HDが故障しなければ必要のない機能なんでしょうが。。。) その後1年くらいサーバーを連続稼動させていますがHDは故障もなく動いています。 たまにHDケーブルをつなぎ変えて物理的に故障診断をしなくてはいけないかもしれませんね。
|
Re: RAID構築後のsmartdのエラー ( No.9 ) |
|
- ????????? 2007/02/07 09:28
- ????????? 管理者
-
セブンさん。ももんがさん。
当方は現在「ATA133RAID-PCI2」を使用していませんが当時はやはり、smartdは停止させていました。 その代わり、logwatchによりHDD障害時はエラー報告が上がります。(実際にエラーとなりました。)
正確なエラーメッセージを覚えていなかったのですが、以下の様な感じだった気がします。 hdc: status error: error=・・・・・ hdc: seek error・・・・
ただ、システムからRAIDしたドライブは「hdc」の様に1台として認識されている為、 実際故障したドライブ「hda」か「hdb」かはわかりません。 試行錯誤で、ドライブをM/Bに取り付けてエラーが出たほうが故障と判断していました。
|
Re: RAID構築後のsmartdのエラー ( No.10 ) |
|
- ????????? 2007/02/08 05:19
- ????????? セブン
-
管理者さん、ももんがさん、
貴重なご意見ありがとうございます。 Smartdを止めてもLogwatchがHDのエラー検出をしてくれるのを知って安心しました。 また同じRAIDを使用し1年以上問題なく連続駆動している実績もありがたい情報です。 実際にサイト運営しているかたのご意見は千金の重みを持ちまね、 僕も現状のRAID構成について、あまり神経質にならず、他に課題は山積していますので、 さらに前に進んで行きたいと思います。 今後ともどうぞ宜しくお願いいたします。
|