はじめての自宅サーバ構築 - Fedora/CentOS - Last Update 2008/08/06
It opened to 2004/09/19. Visitors
Pageviews
Today(IP/PV)
3,407,753
12,990,506
1,289/7,903
このページは表示専用です。新規投稿・レスや最新情報はこちらです。

このスレッドはクローズされています。記事の閲覧のみとなります。
namazuの文字コードについて
日時: 2008/06/10 09:28
名前: namazu

いつも有益な情報ありがとうございます。

さて、
@不明点・障害内容:

はじめての自宅サーバ構築 Fedora/CentOS - サイト内検索システムの構築(Namazu)
http://kajuhome.com/namazu.shtml#n04

を参考に、namazuをセットアップしたのですが、少し質問があります。

文字コードのことなのですが、

私のサーバーは、
Fedora8のデフォルトコードは、UTF8.
/var/www/html内のファイルは、ほどんどがSHIFT-JIS(一部違うコードがあります。)です。

ご説明内の設定をみると、
namazuのvi /etc/namazu/mknmzrc内をeucJPにしていますが、
Webインタフェースの追加の部分をshift-jisのページ追加すると、
日本語がうまく検索されないようです。(見つかりませんとなります。何か設定がおかしいのでしょうか?)
直接URLで検索ページを開いて同じ語句で検索するとうまくいくようです。

管理人様のTOPページは、SHIFT-JISで、namazuの結果ページは、EUCでちゃんと検索されますので、
たぶん設定がおかしいと思いますが、何か注意点はありますでしょうか?

Aログの有無   :
  (有:その内容):無し
BDistribution  :
      Version:fedora8
CService Name  :
      Version:
Dネットワーク構成:
Re: namazuの文字コードについて ( No.1 )
日時: 2008/06/10 10:35
名前: 管理者

> 日本語がうまく検索されないようです。(見つかりませんとなります。何か設定がおかしいのでしょうか?)

検索時はどの様に実行していますか?(Webインタフェースからの検索?コマンドラインからの検索?)
コマンドラインからの検索では当方で検証した処、同じように検索できず以下を行う事で検索は行えました。

1.ロケールを「eucJP」に変更
# export LC_ALL=ja_JP.eucJP
2.ターミナルソフトを「EUC-JP」に変更

3.コマンドラインで検索
# namazu 漢字 /var/lib/namazu/index/

※:webインタフェースからの検索では、システムコード問わず(「UTF-8」「EUC-JP」)問題なく検索できました。
Re: namazuの文字コードについて ( No.2 )
日時: 2008/06/12 20:29
名前: てんまる
参照: http://hibiki.servebbs.com

namazu様 はじめまして。

さて、うちのサーバーも同様Fedora8で、デフォルトコードもUTF8のままです。eucJPにしてしまった際にエラーが出て、デフォルトのままで使っています。

そこで、namazuの設定ですが、

/usr/bin/mknmz -aO /var/lib/namazu/index/ /var/www/html/|nkf -w

でインデックスを作成させています。ちなみに「|nkf -w」はUTF8にて使う際に入れなければならないものらしいです。
(あやふやな答えでごめんなさい。どこかのHPから調べて入れていたメモが出てきました。)
これでOKじゃないでしょうか?


Re: namazuの文字コードについて ( No.3 )
日時: 2008/06/29 10:02
名前: namazu

管理者、てんまるさまありがとうございます。

以下のサイトを参考にしたのですが、↓
全文検索システムNamazu(Windows用)の設定覚書
http://sakaguch.com/SetNamazu.html

<input type="hidden" name="idxname" value="****">

idxnameの指定が抜けておりました。


Copyright(©)2004-2008 First home server construction. All Right Reserved.