このスレッドはクローズされています。記事の閲覧のみとなります。
RAID構築後のsmartdのエラー |
|
- æ¥æï¼ 2007/02/03 08:07
- ååï¼ セブン
- ①不明点・障害内容:RAID構築後(ATA133RAID-PCI2によるRAID-1)、Smartdからエラーメッセージ。SmardはRAID-1で動いているHDが見えていないのだろうか?
②ログの有無 : (有:その内容): --------------------- Smartd Begin ------------------------
**Unmatched Entries** Device: /dev/hda, not found in smartd database. Device: /dev/hda, ATA IDENTIFY DEVICE words 82-83 don't specify if SMART capable. Device: /dev/hda, to proceed anyway, use '-T permissive' Directive. Unable to register ATA device /dev/hda at line 30 of file /etc/smartd.conf Device /dev/hda not available Device: /dev/hda, not found in smartd database. Device: /dev/hda, ATA IDENTIFY DEVICE words 82-83 don't specify if SMART capable. Device: /dev/hda, to proceed anyway, use '-T permissive' Directive. Unable to register ATA device /dev/hda at line 30 of file /etc/smartd.conf Device /dev/hda not available
---------------------- Smartd End ------------------------- ③Distribution :Fedora 5 Version: ④Service Name : Version: ⑤ネットワーク構成:
何時もお騒がわせしておりますセブンです。 このサイトには大変にお世話になっております。 毎日送られてくるLogwatchメールにSmartdが検出した警告メッセージがありました。 今まで見たことの無いメッセージに加えRAID構築直後なので、RAID絡みの症状なのかなと思っております。 メッセージを見る限りHDに障害があるということではなく、それ以前に/dev/hdaとうまくやり取りできていない感じです。 あまり心配はしていないのですが、せっかく動いている機能ですので、しっかりと仕事をして欲しいと思っています。
ちなみに/etc/smartd.confファイルの30行目のコードは以下の通りです。
# A very silent check. Only report SMART health status if it fails # But send an email in this case /dev/hda -H -m root
それと、以下のコマンド(smartctl)を実行してみました。 その答えの一つとして、SMARTはATA Versionの3以上でのみ有効とあり、 使用しているHDのATA Versionは1となっていました。これが原因なんでしょうか? もしそうであれば、何故いままで文句を言ってこなかったのでしょうか???
[root@websrv etc]# smartctl --all /dev/hda smartctl version 5.36 [i686-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION === Device Model: Integrated Technology Express Inc Serial Number: 5 Firmware Version: [No Information Found] Device is: Not in smartctl database [for details use: -P showall] ATA Version is: 1 ATA Standard is: Exact ATA specification draft version not indicated Local Time is: Fri Feb 2 14:56:48 2007 PST SMART is only available in ATA Version 3 Revision 3 or greater. We will try to proceed in spite of this. SMART support is: Ambiguous - ATA IDENTIFY DEVICE words 82-83 don't show if SMART supported. A mandatory SMART command failed: exiting. To continue, add one or more '-T permissive' options.
同じような症状で悩まれたご経験のあり方のご意見をお伺したいと思っております。 どうぞ宜しくお願いいたします。
|
■ コンテンツ関連情報
Re: RAID構築後のsmartdのエラー ( No.1 ) |
|
- æ¥æï¼ 2007/02/03 12:48
- ååï¼ 管理者
- 当方でも先程「smartd」を起動してみました。
現状では起動ログしかありませんが、後日「logwatch」を確認してみたいと思います。
ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。 これはRAIDカードのスペックに依存するようです。 以前、「ATA133RAID-PCI2」は全く取得できませんでしたが現行の「Serial ATA RAID 1210SA」ではある程度取得できています。
|
Re: RAID構築後のsmartdのエラー ( No.2 ) |
|
- æ¥æï¼ 2007/02/03 20:58
- ååï¼ セブン
- 管理者さん、
わざわざ僕の質問の回答のためにSmartdをご自身のPC上で再起動してくださったのですね、 本当にありがたいサイトだと思っております。サイト管理者が現場で悩んでいる人と同じ視点で 疑問に答えようと勤めて下さっている。このような僕がこんな風に書いてよいかわかりませんが、 管理者さんのお人柄がこのサイトの最大の魅力だと思っております。 普通でしたら「お使いのRAIDだったら、Smartdを止めた方がいいですよ」なんて 回答でかたずけてよいはずなのに、ここはそうではありません。 僕もいろんな組織を見てきましたが、成功の鍵は中心者の一念心、その人ががどれだけ現場で 奔走しているかのようです。 このサイトは必ずやこれからも発展していくと確信しています。 本当にありがとうございます。
ところで、以下の言い回しがわかりません。もう少しSmartdを勉強してみようとおもいます。
> ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。
|
Re: RAID構築後のsmartdのエラー ( No.3 ) |
|
- æ¥æï¼ 2007/02/04 09:47
- ååï¼ 管理者
- セブンさん
> わざわざ僕の質問の回答のためにSmartdをご自身のPC上で再起動してくださったのですね
ご回答できる部分と不可能である部分によって、当方にて検証できるかによります。 例えば今回のH/W関連に依存する場合、同様の機器構成であれば問題ありませんがセブンさんの場合は RAIDが間に絡んでいますよね。 同様の構成でないと事象が異なるケースも発生してしまいます。この場合新たにRAIDを購入して・・・ という訳にはならないので回答が難しいのが現状です。 しかし、型番こそ違いますが当方も構成としては同じです。明確な回答はできないかも知れませんが 解決への糸口へなればと存じます。
P.S. 色々と激励のお言葉、ありがとうございます。発展するかは未知ですが今後も頑張らせて頂きます。
============================
さて、本題ですが「logwatch」の結果をご報告いたします。 smartdの仕組みはわかりませんがログには何も出力されませんでした。(smartd)セクションもありません。
ちなみに昨日「smartd」を起動した時のシスログが以下になります。
Feb 3 12:44:25 fedora smartd[15234]: smartd version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Feb 3 12:44:25 fedora smartd[15234]: Home page is http://smartmontools.sourceforge.net/ Feb 3 12:44:25 fedora smartd[15234]: Opened configuration file /etc/smartd.conf Feb 3 12:44:25 fedora smartd[15234]: Configuration file /etc/smartd.conf parsed. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, opened Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, found in smartd database. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sda, is SMART capable. Adding to "monitor" list. Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sdb, opened Feb 3 12:44:25 fedora smartd[15234]: Device: /dev/sdb, found in smartd database. Feb 3 12:44:26 fedora smartd[15234]: Device: /dev/sdb, is SMART capable. Adding to "monitor" list. Feb 3 12:44:26 fedora smartd[15234]: Monitoring 2 ATA and 0 SCSI devices Feb 3 12:44:26 fedora smartd[15237]: smartd has fork()ed into background mode. New PID=15237.
気になった点が・・・・(以下引用) > ちなみに/etc/smartd.confファイルの30行目のコードは以下の通りです。 > > # A very silent check. Only report SMART health status if it fails > # But send an email in this case > /dev/hda -H -m root > > それと、以下のコマンド(smartctl)を実行してみました。 > その答えの一つとして、SMARTはATA Versionの3以上でのみ有効とあり、 > 使用しているHDのATA Versionは1となっていました。これが原因なんでしょうか? > もしそうであれば、何故いままで文句を言ってこなかったのでしょうか??? > > [root@websrv etc]# smartctl --all /dev/hda
デバイス名が「hda」の「h」になっていますが、「s」ではないですよね? RAID接続すると、大抵はSCSIとみなされ「sda」となるようです。
>> ちなみに、RAIDを組んだ場合「S.M.A.R.T」で取得できる部分が限定されます。
言葉の表現と説明不足でした。すみません。 上記の様にデバイス名が変わってしまう問題や「S.M.A.R.T」で取得できる項目(例としてHD温度) が取得できたり出来なかったりします。 コマンド実行毎にできたりできなかったり・・と言う意味ではありません。 RAID-CARDがHDとの通信に対応しているか否かと言うことです。
後、「smartctl」コマンドですが「ATAだよ」と教えないと当方の場合は何も答えてくれませんでした。
【通常(一般的なコマンド)】
# smartctl --all /dev/sda smartctl version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Device: ATA HDS722512VLSA80 Version: V33O
In Linux, SATA disks accessed via libata are only supported by smartmontools for kernel versions 2.6.15 and above. Try an additional '-d ata' argument.
【「-d ata」を付加したコマンド】 # smartctl -d ata --all /dev/sda smartctl version 5.36 [i386-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
=== START OF INFORMATION SECTION === Model Family: Hitachi Deskstar 7K250 series Device Model: HDS722512VLSA80 Serial Number: VN6C3ECCDBM86D Firmware Version: V33OA63A User Capacity: 123,521,334,784 bytes Device is: In smartctl database [for details use: -P show] ATA Version is: 6 ATA Standard is: ATA/ATAPI-6 T13 1410D revision 3a Local Time is: Sun Feb 4 08:54:26 2007 JST SMART support is: Available - device has SMART capability. SMART support is: Enabled : : : SMART Error Log Version: 1 No Errors Logged
SMART Self-test log structure revision number 1 No self-tests have been logged. [To run self-tests, use: smartctl -t]
Device does not support Selective Self Tests/Logging
よって、「smartd.conf」の設定は、以下の様になっています。
# A very silent check. Only report SMART health status if it fails # But send an email in this case /dev/sda -d ata -H -m root /dev/sdb -d ata -H -m root
現状では、ここまでしか情報共有できませんが引き続き模索してみたいと思います。
|
Re: RAID構築後のsmartdのエラー ( No.4 ) |
|
- æ¥æï¼ 2007/02/05 14:56
- ååï¼ セブン
- 管理者さん、
ご親切なご返答、とても感謝しております。 また返事が遅れてしまい大変に申し訳ありません。
一つ御報告なんですが、最新のLogwatchの出力にSmartdの内容が消えていました。 何の変更も加えていないのに、理由はまったく分かりません。 また、管理者さん御指摘のようにHWの構成の違いからなのでしょうか、僕の環境下ですと いくつかの相違点があるようです。
1.RAID環境下でも/dev/sdaではなく/dev/hdaとして認識しているようです。 /dev/sda というデバイスファイルは存在してないみたいです。
[root@websrv ~]# smartctl -d ata --all /dev/sda smartctl version 5.36 [i686-redhat-linux-gnu] Copyright (C) 2002-6 Bruce Allen Home page is http://smartmontools.sourceforge.net/
Smartctl open device: /dev/sda failed: No such file or directory
[root@websrv ~]# ls -lt /dev/sd* ls: /dev/sd*: No such file or directory [root@websrv ~]# [root@websrv ~]# ls -lt /dev/hd* brw-r----- 1 root disk 3, 1 Feb 4 10:55 /dev/hda1 brw-rw---- 1 root disk 22, 0 Feb 4 10:55 /dev/hdc brw-rw---- 1 root disk 22, 64 Feb 4 10:55 /dev/hdd brw-r----- 1 root disk 3, 0 Feb 4 02:55 /dev/hda brw-r----- 1 root disk 3, 2 Feb 4 02:55 /dev/hda2
2. '-d ata'オプションを付けても付けなくても出力に変化はありませんでした。 '-d' オプションを処理する以前にエラーが出ているためかもしれませんね。
とにかく、LogwatchにSmartdの警告メッセージが消えてしまったこと、不思議です。 果たしてRAIDコントローラーはS.M.A.R.TというHDの自己診断機能の助けを得て HDDの不良解析をしているのかどうか?僕にとって大きな関心事ですね。 もし使っているのであればsmartctlコマンド実行時の警告メッセージやSmartd のLogwatch上に出力されたメッセージが気になります。 もしRAID-CはS.M.A.R.Tと連帯していないのであれば、今回の症状は無視しても よいのかなと思っておりますが。 いずれにしましても、僕自身のHDD,RAIDに関する知識不足を痛感しております。 今後とも監視を継続していこうと思っております。
引き続き、もしご意見等ある方、ご一報いただければありがたいと思っております。 宜しくお願いいたします。
|
Re: RAID構築後のsmartdのエラー ( No.5 ) |
|
- æ¥æï¼ 2007/02/05 18:01
- ååï¼ やすお
- 管理者さんも書かれておりますが、ATA133RAID-PCI2を仲介するとSMART情報が正しく取得できないようです。
僕の場合も、直接HDをマザーに取り付けた時のSMART情報と、ATA133RAID-PCI2に取り付けた時ではSMART情報が全く異なる(ほとんど取得できません)
smartdが使用するハード情報DBには、大抵のHDの情報があるみたいですがRAIDカードを通すと命令がHDまで届かないORHDから結果が返却されない等があるみたいです。
後、予断ですけど僕の場合RAID1にすると /dev/hdc のように1台としてしか認識されません。(hda hdbは何処へ??)
管理者さんが sda と仰っているのはお持ちのHDがS−ATAなのでSCSIと認識されると言いたいのだと思います。 セブンさんはATAなので hdx と置き換えてお読みになられた方が宜しいかと思います(困惑されていたらですが・・・・)
|
■ その他