Last Modified: 05/25/1998
Namazu に関するよくある質問とその答えをまとめた文書です。 このファイルの最新版は http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/FAQ.html にあります。
Namazu はできるかぎりお手軽に使えることを目指しています。 技術的には決して高度なものではありませんが、 手軽に使えるという面では割といい線をいっていると思います。 ただし、別途 KAKASI/ChaSen とその辞書が必要なので使えるディスク容量に余裕がないと使えません。 詳しくは intro.htmlを参照してください。 メーリングリストを開設して比較的活発にメンテナンスが行われているのも特徴といえると思います。
Win32版に関する詳しい情報は広瀬さんによる 全文検索システム Namazu for Win32のページを参照してください。
OS/2版に関する詳しい情報は清水さんによる Kaz SHIMZ (SHIMIZU Kazuyoshi) presents "NetWarp World"のページを参照してください。
もしも古い Namazu をお使いならば最新のものを試してみてください。 既に解決しているかもしれません。 そうでなければ作者またはメーリングリストの方へご報告ください。 できるだけ対処したく思っています。
何か良いアイディアがあれば 作者またはメー リングリストの方まで要望を提案してください。 念のため、その前に ToDo に目を通してみてください。 有用なものであれば取り入れていきたいと思います。
問題ありません。どうぞご利用ください。 ただし完全に無保証ですのでその点はご了承ください。 Namazu のライセンスは GPL (日本語訳) に従うものとします。
フリーソフトウェアの文化に貢献したいと考えるからです。 ちなみに Namazu の開発環境は Debian GNU/Linux + XFree86 + Mule + gcc + Perl + Apache と OS を含めすべてフリーソフトウェアで揃えられています。
特に意味はないです。思いつきで決めました。
質問する前にまずドキュメントをしっかり読んでください。 どうしても分からないときは
% uname -a
と実行してみてください
% namazu -v
と実行してみてください
% perl -v
と実行してみてください
% gcc -v
と実行してみてください
% nkf -v
と実行してみてください% telnet localhost 80<改行>
HEAD / HTTP/1.0<改行>
<改行>
について書いて作者またはメーリングリストの方へ送ってください。 ただし、質問しても必ず答えが返ってくるとは限らないのでその辺はご了承ください。 作者はその義務を負いません。
身近に詳しい人を見つけて教えてもらってください。
FreeBSD の /usr/bin/perl はヴァージョン 4 という古いもの
だったと思います。 mknmz の先頭の /usr/bin/perl
を書き替えて
v5.003 以降の Perl のパスを正しく指定してください。
KAKASI のドキュメントを読んでがんばってください。 または身近に詳しい人を見つけて教えてもらってください。
大きなファイルを処理していると Out of memory! になってしまうことがあります。
この場合は mknmz の中の $FILE_SIZE_LIMIT
の値を下げると解決すると思われます。
同じように、たくさんのファイルを処理していると同じように Out of memory! になってしまうかもしれません。
この場合は mknmz の中の $ON_MEMORY_MAX
の値を下げると解決すると思われます。
また、v1.2.0 からはフレーズ検索用のインデックスを作成するために以 前のヴァージョンよりもメモリを多く消費します。フレーズ検索が不要な 方は mknmz に -P オプションをつけて実行してください。
おそらくそれは CGI として実行されているのではなく、 namazu.cgi の中身がそのまま表示されているのでしょう。 CGI が実行できるようにサーヴァの設定をしてください。
これは正規表現で指定しています。 プログラミング Perl 改訂版 などを参照してください。
SunOS4.x の memcmp(3) の実装により、 Perl で EUC の日本語文字列を比較する際に unsigned/signed の扱いで問題が発生していたようです。 この問題は最近の Perl では解決しているそうなので、新しいものを使ってください。 また、一応 v1.1.1.3 以降の Namazu でも対処するためのコードを入れています。
v1.1.1 からは MHonArc v2.1.0 以降ののインデックスファイルを自動認識して除外するようにしました。 ヘッダを照合して確認しているので古い MHonArc で作ったアーカイヴについては対応していません。
MHonArc の v2.1.0 より前のヴァージョンのものは自動判別がききません。 MHonArc のヴァージョンをあげることをお勧めします。
MHonArcのサイト
http://www.oac.uci.edu/indiv/ehood/mhonarc.html
Namazu はひとつのディレクトリにひとつだけしかインデックスを置けないという仕様になっています。 ですから、 NMZ.* の名前を変更してもあまりメリットはないと思われます。
nkf32と kakasi がパスの通ったところに置かれているか確認してください。
辞書のメンテナンスが容易なこと、動作が軽いことを考えると KAKASI の方が扱いやすいように思われます。 もちろん本格的な日本語の処理を行うには ChaSen の方が向いています。
KAKASI付属の kakasidict (テキストファイル) に単語を追加して KAKASI の make 時に一緒に作られた mkkanwa というプログラムを使って バイナリ形式の辞書に変 換します。 出来上がった辞書は kanwadict という名前で /usr/local/lib/kakasi あたりにコピーすればよいでしょう。
フリーのかな漢字変換用辞書については馬場肇@京大さんによる Freely available dictionaries for kana-kanji conversion に情報がまとまっています。
一時期、ドキュメントの中で (かな漢字変換用の) 「字書」という表記を使っていましたが、一般的な「辞書」に戻しました。 深い理由はないです。
mhfile.pl の sub file_open の
return $handle if open($handle, $file);
の部分を
return $handle if open($handle, "nkf -em $file|");
に変更するのがお手軽です。
email: ccsatoru@vega.aichi-u.ac.jp
Namazu のページ: http://saturn.aichi-u.ac.jp/%7Eccsatoru/Namazu/