ホーム > HTMLに役立つヒント > マニュアルに書いてないNAMAZU > NAMAZU基礎用語辞典
NAMAZUを設置するために、最低限知っておきたい基礎用語をかいておきます。ここは大事。次のテストにでます。
別窓で開いているはずですから、必要に応じてブラウザの検索機能で検索して理解の助けにしてください。順番がぐしゃぐしゃですが、勘弁してチョ。
ファイルトランスファープロトコルの略です、といっても実際の役に立たないので、何をするのかというと、手元にあるファイル(CGIとかhtmlファイルとか)をサーバに送り込む/サーバから取ってくる/アップロード/ダウンロードするための手続きのことです。
FTPツールというのはそれ(サーバとのファイルのやりとり)を実行するプログラムのことです。
手元にコンピュータ関係の雑誌があったら、付録のCDを見てください。多分その中にFTPツールが入ってます。MACなら「Fetch」というのがそれです。使い方は簡単ですからわかるでしょう。
自分のパソコンを一時的にサーバの端末にすることを「telnetする」といいます。telnetはホントにサーバの端末になりますから、見慣れたウインドウズやマックのGUI環境とは異なります。ひたすらコマンド打ち込みの世界です。
手元にコンピュータ関係の雑誌があったら、付録のCDを見てください。多分その中にtelnetツールが入ってます。MACなら「BetterTelnet」というのがそれです。これを起動してサーバに接続し、ファイル操作などをやります。ファイルのコピー、削除をはじめ、パーミッションの設定などなど、多彩なことができます。NAMAZUのインストールにはこれが使えることが必須です。
もしあなたのプロバイダがtelnetを許していないなら、フルNAMAZUをサーバにインストールすることはあきらめた方がいいです。pnamazuなど他の手段を考えましょう。
telnetの操作にはコマンドが必要になりますが、コマンドは知っておきたいUNIXコマンドを参照してください。
サーバにおかれているファイルのモードのことです。サーバはたくさんの人がアクセスしてきますから、人に書き換えられたくないファイルとかを保護したり、検索されたくないファイルを制限したりするときにそのファイルの「ファイルモード」を設定してやります。
755とか444とか644とかいうのがパーミッションの状態を示しています。
この数字は次のようなことを意味しています。
パーミッションを設定するには、FTPツールか、telnetで行います。下の図はFTPソフトを使ってパーミッションを設定しているところです。
左から「読む4点」「書込2点」「検索実行1点」とポイントがあると考えてください。このポイントの合計がパーミッションの数字になります。
例:741の場合
4点 2点 1点
読む 書き込み 検索
オーナー 4 2 1 4+2+1でパーミッション3桁 7
グループ 4 0 0 4+0+0でパーミッション2桁 4
全員 0 0 1 0+0+1でパーミッション1桁 1
こんな感じです。この場合のパーミッションは741ということになります。現実にはこんなパーミッションは設定しないでしょうが。
では突然クイズ。上の図で行くとパーミッションは?(正解は644)
◆telnetの場合
chmod 777 [ファイル名] で設定できます。777の部分がモードです。
◆FTPの場合
FTPソフトにはパーミッションの設定ができるものがあります。上の図のような感じで設定します。
サーバにはみんなが参照する「環境変数」があります。たとえば時間や日付などです。
NAMAZUでは環境変数である「LANG」を日本語に設定しておかないと、mknmzが日本語のインデックスを作ってくれません。設定方法は「自分用の設定を作る」を参照してください。
サーバーには、一般ユーザーにいじられては困る部分があります。この部分は保護されていて、サーバーの管理者でないといじることができません。
それをいじる権限を管理者権限/スーパーユーザー/ルート権限/root権限などといいます。NAMAZUではNAMAZUコマンドなどをサーバーシステムにインストールすることが必要で、そのためには管理者権限が必要になります。
しかし、こればかりは我々一般ユーザーにはどうにもなりません。管理者に相談してみてください。
今いるディレクトリのこと。
階層のこと。MACでいえばフォルダだと思ってください。ただ、MACではフォルダを「開く」が、サーバではフォルダからフォルダ(階層から階層)へ「移動」することになります。Windowsの人もDOSを知っていれば違和感はないでしょうが、最近のユーザーやMACな人は、フォルダを移動することだと思ってください。
ディレクトリ(フォルダ)の移動は基本的には2方向しかないです。上のディレクトリに移動するか、下のディレクトリに移動するか、です。
ディレクトリはツリー構造を持っます。こんな感じ。
パスというのは自分のいる場所や特定のフォルダ(ディレクトリ)やファイルまでの道筋を言います。上の図では「/home/name2/NAMAZU/index/」がパスとなります。
パスの指定方法は相対パスと絶対パスがあります。「/」で始まると絶対パスで、サーバの一番上のディレクトリからの指定のことです。
「./」で始まる指定は相対パス指定で、今いるディレクトリから見た指定となります。「./」だけなら同じディレクトリ、上の例で言うと、現在NAMAZUにいるとして、下のディレクトリは「./index」となります。これは「./」を省略していきなり「index/」としてもいいです。「../」なら今いるディレクトリの上のディレクトリを示します。 NAMAZUにいるとすると「../kb」とすると「kb」ディレクトリを意味します。
漢字表示にはコード(約束事)があります。このコード、やっかいなことに複数あるんですね。サーバで使われているのはEUCというコードで、パソコンではシフトJIS(SJIS)コードです。パソコンで普通にテキストファイルを作るとシフトJISコードになります。これはマックもウインドウズも共通。そのままサーバにアップしても、htmlファイルならともかく、cgiやshといったサーバ上で動かすプログラムでは動作しない可能性が高くなります。
MACではJEDITが複数のコードを扱えるエディタの代表選手です。Windowsでは秀丸エディタがそれに当たります。これらを用意しておきましょう。
改行コードは環境によって異なります。UNIXサーバではLF、MACではCR、WindowsではCF+LFです。cgiなどでこの改行コードが違っていると、サーバは(というよりperlなどのcgi動作ソフトが)プログラムの区切りを理解できなくなります。てーことは、改行コードが違っているとcgiは動きません。htmlの場合はサーバは単に送り出すだけで、解析するのはクライアントサイドのブラウザがやります。ブラウザはもともと改行コードを無視します(改行はhtmlタグである<br>などで判断する)から問題はありません。
.docファイルなどをテキストファイルだと勘違いしている人がいますが、.docファイルはMSワードのファイルであってテキストファイルではありません。普段は見えませんが、.docファイルの中には書式設定や罫線の設定などが格納されています(みんなが普段使っているパソコンの場合)。
テキストファイルというのは.txtファイルのことで、こちらは文字と改行コード以外の情報は入っていません。サーバで扱うファイルの多くはテキストファイル(はっきり区別するために「プレーンテキスト」とも呼ばれる)でなくてはなりません。HTMLファイルもテキストファイルの一つです。
サーバ上においてある.docファイルや、配布されているcgiプログラムなどに含まれる.docファイルは、パソコンの.docファイルと異なりプレーンテキストです。
つまり、サーバ上の.docファイル.txtファイルは同じです。パソコン上の.docファイルとサーバ上の.docファイルは、拡張子では区別できません。ややこしいですが、これはマイクロソフトがMSワードのファイル拡張子をつけるときに勝手に.docとしてしまったためで、全面的にマイクロソフトの責任です。頭に来た人はビル・ゲイツにメールしてください。
テキストファイルの編集にはエディタが一番適しています。
正確には「テキストエディタ」という。テキストファイルを作ったり編集したりするソフトのことで、ワープロと異なり文字と改行コード以外の余分な情報は扱いません。
MACではJEDITが複数の改行コードを扱えるエディタの代表選手です。Windowsでは秀丸エディタがそれに当たります。これらを用意しておきましょう。
関連事項としてこのファイルで「改行コード」「漢字コード」「テキストファイル」を参照してください。
UNIXシステムの中にもエディタはあります。代表的なのが「vi」エディタ。すんごく使いにくいです。cronに登録するときなどのように、直接サーバ上のファイルをいじらなくてはならないという場合をのぞいてお勧めしません。
高速日本語全文検索システムの名前。
NAMAZUシステムの検索コマンド。NAMAZUをシステムにインストールするとこのコマンドが拡張され、システム上で使えるようになります。コマンドの引数などはNAMAZUに付属のdocファイルに書いてあります。
NAMAZUシステムのcgi版。namazuコマンドと共にサーバ上に生成される。このcgiを呼び出す(アクセスする)ことでブラウザからNAMAZUシステムを利用することができるようになります。
ぢつはNAMAZUではなくUNIXの方のお話。
ここで言っているのは「コマンドサーチパス」のこと。これは、どこにコマンドが格納されているのかシェルに教えることを意味してます。
ひらたくいうと、シェルはサーチコマンドパスのリストを見て、そこにコマンドを探しに行きます。「パスを通す」というのは、このリストにパスを追加することなんですね。
具体的には、「/usr/namazu」というパスを追加したいなら、次のようにやります。
set path=($path /usr/namazu)
パスの内容を確認するには次のようにします。
echo $path
たまにパスを通したのにうまくコマンドを認識してくれないことがあるそうです。そのときには、次のようにします。
rehash
パスで指定されたディレクトリの八種テーブルをもう一回計算し直すためのコマンドだそうで、これでたいていパスは動くそうです。
NAMAZUシステムのインデックス作成コマンド。NAMAZUをシステムにインストールするとこのコマンドが拡張され、システム上で使えるようになります。コマンドの引数などはNAMAZUに付属のdoc/manual.htmlファイルに書いてあります。
コマンドにはコマンド(例:「find」)と、それに「-」で続くオプションがあります(例:「find -name」)。このオプションに対応する記述を引数といいます(例:「find -name [見つけるファイル名]」)。NAMAZUでも、例えばインデックスを作るにはmknmzというコマンドと、その後に続くオプションがあります。
インデックスの出力先を指定し、インデックス対象リストにしたがってインデックスを作成させることにします。manual.htmlには「-O, --output-dir=DIR インデックスの出力先を指定する」「-F, --target-list=FILE インデックス対象のファイルのリストを読み込む」となっています。これを指定するには、こんな風にします。
mknmz -O インデックスの出力先 -F インデックスの対象リスト
コマンド、オプション、引数(オプションに対応する記述)、という順番になるわけです。なお、mknmzは、基本的に「mknmz オプション インデックス対象ディレクトリ」となり、最後がインデックスにする対象ディレクトリの指定です。上の例では対象リストを読み込ませるため、最後に対象ディレクトリを記述していません。例外ですね。
NAMAZUでは、検索対象ファイルの中味をあらかじめ調べて、どんな単語がどこに記述されているか、いわばファイルの地図を作製します。この地図をインデックスといいます。本の目次(インデックス)のようなものです。mknmzコマンドでインデックスを作ります。