はじめての自宅サーバ構築 - Fedora/CentOS -
Last Update 2018/01/16
[ 更新履歴 ] [ サイト マップ ] [ 質問掲示板 ] [ 雑談掲示板 ] [ リンク ]
トップ >> 当サイト情報 >> スレッド

このページは表示専用です。新規投稿・レスや最新情報はこちらです。

このスレッドはクローズされています。記事の閲覧のみとなります。

 Centos5突如暴走−−>起動不能
日時: 2007/04/27 10:57
名前: 渡来或

?不明点・障害内容:Centos5でサーバを構築中に、まるでプログラムがループしているがごとく突如CPUが暴走を始めます。
?ログの有無   :再起動時、「Error 15:File not found」と表示されます。
  (有:その内容):
?Distribution  :
      Version:
?Service Name  :
      Version:
?ネットワーク構成:
ちなみに、マシンは、DELL GX260 です。
暴走しているときにシステムモニタを見ても、特にCPUを食っているJOBは見当たらないのです。
過去に、Fedoraで同じような経験をした記憶があるのですが、原因と対策をご存知の方がいらしたら教えてください。
再起動時にディスプレイに表示されるメッセージは以下のとおりです。
Filesystem type is ext2fs, partition type 0x83
kernel /vmlinuz-2.6.18-8.1.1.el5 ro root=/dev/VolGroup00/LogVol00 rhyb quiet
Error 15: File not found
Press any key to continue...
(以上です)

■ コンテンツ関連情報

 Re: Centos5突如暴走−−>起動不能 ( No.1 )
日時: 2007/04/27 17:24
名前: house

こんにちは。

1 メモリに問題がある

とりあえず、メモリに不具合が無いかどうか確認してみたらどうでしょうか?

こちらのサイトに、

memtest86

についての記事があったと思うので
それを試してみてください。

2 メモリに問題が無ければ
ハードディスクに不具合はないでしょうか?
 Re: Centos5突如暴走−−>起動不能 ( No.2 )
日時: 2007/04/30 07:32
名前: 渡来或

houseさんありがとうございました。
・・・で、自己解決と言いますか、全く解決しないんですけど・・・
3台のPCで試してみたのですが、いずれも暴走を始めました。ということで、HDDやメモリーが原因ではなかったようです。
そして、3台目でシステムログを見ることができて、これが原因なのかどうかわからないのですが、CLAMD /usr/bin/lockfile destroied(?)といった記録がありました。暴走しているときのシステムモニタで起動しているものの一つにCLAMDがありましたが、そのプロセスのCPU稼働率は数パーセントと表示されていたのですが、必要なファイルが破損してループしていたのかもしれません・・・・
そこで、デスクトップとして使用しているPCもUPDATEしてから、再起動時にファイルが認識できないことがあって、すんなり起動しないことがあることを思い出したので、UPDATEの際にKERNELを除外して実行しました。
そして、サーバーを構築する作業をしてみたところ、全く暴走は無く、当然PCは熱くもならず静かに動いてます。
私の結論としては、KERNELのリビジョンが一つ上がったらUPDATEをしてみようかと思っています。とほほ・・・。
このような場合、ベンダーを待つしかないのですか???
 Re: Centos5突如暴走−−>起動不能 ( No.3 )
日時: 2007/04/30 08:41
名前: 渡来或

追加情報です。
安定稼働できたかなと思いきや、やはりCPU使用率が100%近くで、ずっと推移していて、高熱を出し始めましたので、ここらで停止しようと思います。
訳が分からないからcentos、fedoracoreは諦めるしかないのかな・・・・
 Re: Centos5突如暴走−−>起動不能 ( No.4 )
日時: 2007/04/30 10:58
名前: kuro

純粋にCentOSをインストールしただけですか?

CLAMDって、アンチウィルスのプロセス??
 Re: Centos5突如暴走−−>起動不能 ( No.5 )
日時: 2007/04/30 14:03
名前: 渡来或

kuroさんこんにちは
そのとおりです。Clamav AntiVirus のことです。
パッケージに無いので、Dag RPM Repository for Red Hat Enterprise Linux(http://apt.sw.be/redhat/el5/en/i386/dag)からインストールしています。
疑問に思われているとおり、パッケージ以外のものを取り込んでいるので何が悪いか分からなくなっています。ですが、ある程度のセキュリティをと考えますと、パッケージ外から持ってこざるを得なく、CentOS4.4までは同じようにしていまして、全く問題なかったので、5になって、4から変わった点は考慮しつつ4の時と同じようにソフトをインストールしようとしています。
 Re: Centos5突如暴走−−>起動不能 ( No.6 )
日時: 2007/04/30 23:46
名前: house

こんにちは。

RHEL系(CENTOS)は、変わったことをしようとすると、
rpm管理がしにくくて、依存性で悩まされた記憶があります。

私の場合は、CENTOS4.2の頃に、
色々なサーバー管理ソフト
ウイルス対策ソフト
トムにゃんコ(トムキャット)
その他新しいことを数知れず
やってみた結果、
まず、YUMが崩壊して使い物にならなくなりました。

また、rpmインストールも、
依存性のトラブルに悩まされたことから、
さまざまなrpmをインストールするうちに
やっぱりわけがわからなくなったことがあります。

--------------

新しい技術をたくさんためしたい性格ならば、
CENTOSよりも、FEDORAの方がいいと思います。

-------------

また、新しくなったばかりですから、
1.通常利用するrpmもまだ出揃ってないように思う
2.エラーが出きっていない
ということで、トラブルが多いのかもしれませんね。

-------------

しかし、CLAMAV程度のウイルス対策ソフトは
多くの人が使っている訳ですから、
それが原因であれば、
RHELに細かな情報を送ってみる、というのはどうでしょうか?

(サポートは受けられないでしょうが、CENTOS5のエラーはRHEL5のエラーでしょうから、
少したったら、修正されたrpmとか出るかもしれないように思ったりします。


 Re: Centos5突如暴走−−>起動不能 ( No.7 )
日時: 2007/05/02 13:30
名前: 羊羹

初めましてこんにちは。

私は先日CentOSを使い始めたのですが、サーバを運用中に
同様に「Error 15:File not found」が発生しました。

原因を追っかけてみたのですが、途中を省略して結果だけを書くと

・kernelファイルがロストしていた
・kernelを復旧させると正常に動作した
・復旧後しばらくすると、clamdが同じようにずっとCPUを占有していた。
・clamは手動スキャンは正常に終了するが、スクリプトによる自動実行時に
 100%CPUを占有しいつまでも終わらない

→起動スクリプトを見ると「`」と書くべき所が「'」になっており、
 修正すると問題なく動作した

という事だったようです。

もしもCentOSの解説サイトを見ながらスクリプトを手で打ち込んでいる
場合は、その部分を見直すともしかしたら改善されるかもしれません。
 Re: Centos5突如暴走−−>起動不能 ( No.8 )
日時: 2007/05/03 09:27
名前: 渡来或

hauseさん、羊羹さん
ありがとうございます。
KERNELが1.3になったので、再度サーバーの設定にチャレンジしてみました。
今回は、暴走せずに安定しているようです。
それと、デスクトップとして使用しているPCも、UPDATEしてからは、スムーズに起動するようになりました。(以前は、何かのファイルが読み込めなくて起動できずにrebootせざるを得ないことがよくありました。)
yum -y updateで一括してUPDATEしてしまっているので何が悪さをしていたのかわかりませんが、やはり新しくなって間もないころはバグやら、何やらがあるんですね。そんな時期にいろいろやろうとして騒いで申し訳ありませんでした。
いろいろアドバイスいただいた皆さん本当にありがとうございました。
 Re: Centos5突如暴走−−>起動不能 ( No.9 )
日時: 2007/05/03 15:38
名前: 渡来或

しつこくてすみません。
暴走したときに、まずサービスを停止してから(/etc/rc.d/init.d/clamd stop)シャットダウンすると、再度起動させたときに正常に立ち上がることが分かりました。
そこで、ログを見ますと、どうやら1800秒毎にやっているセルフチェックらしいんです。再起動してまた30分程すると暴走が始まります。異常が始まった時刻のログには、
clamd[2898]: //sys/module/sbs/parameters/capacity_mode: unable to open file or directory ERROR
から始まって、延々とファイルが読み込めないといったエラーメッセージが続いています。
どうもプロセスが終了しないように伺えます。
ここで、分かった事項をお知らせします。
 Re: Centos5突如暴走−−>起動不能 ( No.10 )
日時: 2007/05/03 16:56
名前: kuro

この辺が怪しいかも・・・

/etc/cron.d にclamがあるとかないでしょうか?
 Re: Centos5突如暴走−−>起動不能 ( No.11 )
日時: 2007/05/03 19:59
名前: 羊羹

こんにちは。既出かもしれませんが、先ほど判明した事があるので
それを含め調べた事を一通り書いておきます。


まずスキャン時間ですが、さきほどclamdscanを行ったところ
5.58Gに対して79分ほど掛かりました。環境次第で数字が前後
するとは思いますが、気になるなら数日一回や週1の実行にする
のも一つの手でしょうか。


実行時に記録されるエラーですが、属性に-rが付いていない物
に対して'Unable to open 〜'と出ている様なので、特に気に
しないでいいかと思います。


1800秒毎に入るチェックについては、clamdの仕様に関連しているようです。
clamd(あるいはclamdを利用したclamdscan)は、clamscanと違い、スタート
時にローカルのウィルスDBを読み込んでデータを保持し、それを元にウィルス
スキャンを実行します。ウィルスDBそのものの更新はfleshclamで行われます。
DBが更新された時は再読込を実行する必要がありますが、(最近の)clamdには
DBを自分でチェックする機能があり、このチェック間隔のdefault値が1800秒と
なっています。このチェックそのものは単にDBが更新されたかどうか見るだけ
なので、負荷の要因ではないように思えます。
チェック間隔は /etc/clamd.conf あたりで変更できます。


そしてkernelがロストした原因と思われる部分についてです。
rootに届いていたメールの中に、
> //boot/vmlinuz-2.6.18-8.1.1.el5.centos.plus.1: Broken.Executable FOUND
という箇所があり、どうやらclamdscanによって破損した実行ファイルと
認識され削除されていました。clamscanでは問題がなく、clamdscanのtelnetによる
対話モードでscanした所反応したので、clamdscan(ないしはclamd)固有の問題
なのかなと考えています。
とりあえず /etc/clamd.conf の
> DetectBrokenExecutable yes

> DetectBrokenExecutable no
にした所回避できたので、チェックしてみるといいかもしれません。


以下のページでclamについて詳細に書いてあるので参考にされるといいかと思います。
http://clamav-jp.sourceforge.jp/jdoc/clamav.html
http://www.dragoncity.ne.jp/construction/security3-1.html
http://anenable-factory.ath.cx/servmemo/clamanti.php
 Re: Centos5突如暴走−−>起動不能 ( No.12 )
日時: 2007/05/04 11:16
名前: 渡来或

羊羹さん
とても詳しく教えていただきありがとうございます。
確かに、以前のように処理中にシャットダウンをして、再度電源オンしても起動するようになったようです。
でも、相変わらず、セルフチェックだけでなく、clamdscanが始まってしまうというのは、自分の意図するところとは違っているので、(私自身が考え方を変えなければいけないのかもしれませんが)不愉快なものですね。
羊羹さんに教えていただいたことを参考にして、少し時間をかけて勉強してみようと思います。
また、何か参考になることがあれば教えてください。重ね々々ありがとうございました。
 Re: Centos5突如暴走−−>起動不能 ( No.13 )
日時: 2007/05/04 14:54
名前: 羊羹

起動時に自動で clamAV が立ち上がってしまう場合は

> /etc/rc.d/rc*.d/

に clamd へのリンクが存在する事が考えられます。
対応するランレベルのディレクトリににS*clamdが
あれば起動されるので、手動で消してもいいでしょうし、
chkconfigがインストールされている環境ならば

> chkconfig clamd off

とすればサービスの起動が抑制できますし、

> chkconfig --list clamd

で現在の自動起動設定が見られます。
rc.d、chkconfigに関しては以下のページなどに情報があります。

http://park15.wakwak.com/~unixlife/linux/boot-rcd.html
http://www.a-yu.com/pub/qa82.html
 Re: Centos5突如暴走−−>起動不能 ( No.14 )
日時: 2007/05/08 20:00
名前: 渡来或

羊羹さん
いろいろとありがとうございます。
で、自己解決した言いますか、何が原因していて、何を講じたら直ったといったものではありませんが・・。
次のようにしたら全く問題なくなりましたので報告します。
OSをインストールして、一括アップデートしたら、しばらくそのまま放置しておきます。
すると、30〜40分すると、prelinkが走り出し、ディスクに頻繁にアクセスしだします。当然CPU使用率も100%になります。PCはヒートアップして、冷却ファンがブンブン回りっぱなしになります。
40分程しますと処理が終了して静かになります。CPU使用率も5%前後になります。
このような状態になってからclamdをインストールします。clamdscanを実行しても、以前のようにエンドレスではなく、30分弱で終了しました。PCも、再起動しても全く問題なく正常に使えています。
騒いでた頃は、clamdもインストールし、更にサーバーのいろいろなソフトをインストールしていたときに、トラブルが発生していました。全くの推測ですが、prelinkでclamavに必要なファイルを壊していたのではないのかと思っています。で、エンドレスで処理が延々と続いたのではないかな・・・?
何はともあれ、無駄な時間を費やしますが、正常にインストールできます。
皆様いろいろとありがとうございました。

■ その他

ページ先頭へ


Copyright(©)2004-2018 First home server construction. All Right Reserved.