ホーム > HTMLに役立つヒント > マニュアルに書いてないNAMAZU
> NAMAZUをインストールする前に
NAMAZUのインストールを始める前に、予備知識なんぞを少し。
NAMAZUは複数のファイルを扱わなくてはならない上、それぞれのインストール説明書や取扱説明書などが分散していて全体像をつかみにくいことがハードルの高さにつながっていると思います。
まずは全体像をつかんでいただき、導入をやりやすくすることが「マニュアルに書いてないNAMAZU」の目的のひとつです。その中でも導入前に知っておかなくてはならない重要なことを以下に書きます。
重要度:★★★★★
NAMAZUシステムをインストールするには、フツーはスーパーユーザー権限(ルート権限を持っているユーザー、管理者のこと)が必要になります(そうでない人でもインストールは可能。下記の「朗報」を参照)。
|
NAMAZUはインストール条件が厳しく、すんなりインストールできるとは限りません。特に、トラブルに見舞われた場合は、そうとうの技術力がないとインストールは難しいです。そんな場合はほかのソフトを検討してみるのもいいでしょう。全文検索ソフトはNAMAZUだけではありません。 小規模サイトの場合:hiroさんの「全文検索ソフト(Perl版)徹底比較」でお勧めされているとほほさんの「検索フォーム」なら、設置も手軽にできますし、検索の実力も十分です。ダウンロードは「とほほのWWW入門/検索フォーム設置法」からできます。ただし、インデックスを事前に作らないタイプなので、NAMAZUに比べてサーバーの負荷が高くなること、毎回全ファイルを検索するためにスピードがそれほど速くないことは知っておいてください。 中小規模サイトの場合:インデックスタイプでお勧めなのはKatsushi Matsudaさんの「msearch」です。こちらはインデックス作成ツールも検索ツールもperlで書かれていますので、設置は非常に容易です。加えて検索スピードは「検索フォーム」よりも高速です。 これらのソフトについては「HTMLに役立つヒント」からスピードテストも含めて詳しいレポートが読めるようになっていますので参照してください。 |
ひょっとしたらあなたのサーバにはすでにNAMAZUがインストールされているかもしれません。まずはそれを調べましょう。telnetして「namazu -v」と打ち込んでみましょう。
★★★ 朗報! 管理者でなくてもインストールできる ★★★★
管理者でなくてはインストールできないと思っていたあなた! 朗報が飛び込んできました。ぢつはインストールする場所の指定を変更するだけで管理者でなくてもNAMAZUをインストールできるそうです! 「管理者以外の人がインストールする」を見てください。ただし、技量はかなり必要です。
★★★ 朗報2! perl版がある ★★★★★
なんと、もっと簡単な方法がありました。本家NAMAZUをperl化して新機能をつけた「pnamazu」というのがあるのでした。機能は本家に劣らず、しかも設置が簡単。FTPができれば設置できます。これは、手元のマシンでインデックスを作り(このマシンにはNAMAZUをインストールしなくてはならない)、そのインデックスとpnamazuをFTPでアップロードするというものです。
つまり、インデックス自体はNAMAZUで作る必要がありますから、手元にNAMAZUの動くマシン環境が必要になります。Windowsの場合はNAMAZU for win32でインデックスを作ると良いでしょう。MacintoshならOS XにNAMAZU(UNIX版)をインストールしてインデックスを作ります(旧MAC OSではダメです)。サーバにNAMAZUをインストールするより、手元のマシンにインストールする方がはるかに容易です。「pnamazuについて」を参照してください。
重要度:★★★★★
telnetできること、C言語のプログラムをコンパイルできるサーバであること。
telnetできないとNAMAZUのインストールもできませんし、インデックスも作れません。telnetをユーザーに許していないプロバイダではpnamazuを使うと良いと思われます。
C言語のプログラムをコンパイルできないサーバでは、NAMAZUのインストールができません。たいていのサーバではこちらの条件はクリアしていると思いますが、確認方法を知りません(-_-;)
重要度:★★★
namazuで検索する前に、検索する文書のどこに何が書いてあるのか、「目次」を作らねばなりません。これを「インデックスを作る」といいます。
なぜこんなことをするのかというと、たとえば1000あるファイルを全部いちいち覗いて回るより、目次を一つ作ってその中を探す方がはるかに速いし効率的だからです。
さて、このインデックスを作る時に必要になるのがKAKASIやCHASENなどの分かち書きエンジンです(正確には「必要」ではないのですが、効率的なインデックスを作成するにはこれらのエンジンを使った方がいいです)。検索効率の善し悪しはインデックのできばえがいいかどうかにかかってきます。で、日本語の文章からインデックスを作る場合、文章を解析してインデックスに登録します。
KAKASIやCHASENはこの文章解析の部分を担当します。日本語の辞書を持っていて、それに沿って「分かち書き」をします。KAKASIには約10万語の辞書が含まれていますが、一般的な単語です。医学用語など特殊な分野の検索をさせたいときにはKAKASIをインストールした後、KAKASIの辞書に専門辞書を追加する必要があります。
また、KAKASIの代わりにChaSenを使うこともできます。ChaSenの方が厳密なインデックスが作れますが、KAKASIの方が取り扱いが簡単ですし、十分実用的です。ChaSenについてはNAMAZUに付属のドキュメントにも書かれています。
重要度:★★
もう一つ、事前に知っておいた方がいいことがあります。NAMAZUはコマンドラインから実行しますが、インストール時に生成されるnamazu.cgiを使うことでCGIとしてブラウザから検索を実行させることができます。
僕らの目的はもちろんこちらのブラウザからの検索ですね。
前述のようにNAMAZUシステムにはKAKASIなどの分かち書きエンジンがあった方がよいですが、perlモジュール「Text-Kakasi-1.01.tar.gz」もインストールしておいた方が効率的です。これをインストールしておくとインデックスのスピードが速くなります。
NAMAZUをCGIとして動作させる利点は、ブラウザから検索ができるようになることですが、KAKASIのperlモジュールの利点はインデックス作成の高速化です。このモジュールのない時の1.5から2倍程度速くなるそうです。モジュールの組み込みはNAMAZUをコンフィギュレーション(後述)するときに自動的に組み込まれるようです(ホントか? 僕はそう信じてるんですけど)。なので、KAKASIとKAKASIのperlモジュールをNAMAZUより先にインストールします。
重要度:★★
NAMAZUはなんだか面倒そうですが、一応次のようなモジュールを作ればどうにか動きます。
namazu 本体ですね。NAMAZUパッケージに含まれます。通常、サーバー機能(管理者権限領域)にインストールします。
namazu.cgi namazuのcgi版。namazuと共に生成されます。
mknmz インデックスを作成する部分。NAMAZUに含まれていますのでインストールを意識する必要はありません。
kakasi 分かち書きモジュール。サーバー機能にインストールします。
KAKASItext KAKASIをperlから呼び出すためのモジュール。サーバーにインストールします。
これらを作成するためにダウンロードするパッケージ(ファイル)はたった三つです(NAMAZU、KAKASI、KAKASIのcgi利用モジュール)。ね、意外と簡単そうでしょ?
さて、ではいよいよ必要なファイルをダウンロードしましょう。ダウンロードページに進んでください。