variables at ~/.mknmzrc ( see conf.pl also)
変数名
| 初期値(例) | 説明 |
(関係)操作行選択 |
$ADDRESS (*) |
| # admin's email address
(config 時に設定される)
|
$HTML_SUFFIX |
"html?|[ps]html|html\\.[a-z]{2}"
| この接尾語を持つものだけ処理する
|
$ALLOW_FILE |
".*\\.(?:$HTML_SUFFIX)|.*\\.txt"
| 対象譜 (正規表現)(注
1) | -a, --allow= PATTERN
|
$DENY_FILE |
".*\\.(gif|png|jpg|jpeg)| .*\\.tar\\.gz| core|.*\\.bak|.*~|\\..*|\x23.*"
| 除外譜 (正規表現)(注2) |
--deny= PATTERN
|
$EXCLUDE_PATH
| undef | 除外 path (正規表現) |
--exclude= PATTERN
|
$DIRECTORY_INDEX | "" | URL が / で
終っている時の意味。(実際には、表示の時に取除く。一例 index.html
|
$REMAIN_HEADER | "From|Date|Message-ID" |
RFC 822 Header などのうち本文として検索出来るものを指定する
(本文の反対語は
項目検索
)。filters/mailnews.pl だけで参照している。
|
$SEARCH_FIELD |
"message-id|subject| from|date|uri| newsgroups|to|summary|size" |
項目検索
(「+subject: 検索語」のような形式)に使える項目を指定する
|
$META_TAGS |
"keywords|description" | <META の中で見る項目 mknmz に -M を付けると、
項目検索
の項目として索引を作る
|
%FIELD_ALIASES | ('title' => 'subject', 'author' => 'from') |
項目検索の時の項目について、
メール見出名の置換法を指定する |
$NON_SEPARATION_ELEMENTS |
'A|TT|CODE|SAMP|KBD|VAR|'.
'B|STRONG|I|EM|CITE|'.
'FONT|U|STRIKE|BIG|'.
'SMALL|DFN|ABBR|'.
'ACRONYM|Q|SUB|'.
'SUP|SPAN|BDO'
|
これらがあっても単語は切らない
|
$ON_MEMORY_MAX | 5000000 (5M) |
namazu は文書を次々と読んで、それらから、まとめて索引を作る。
その作業は全て記憶域で行なう。
その読んだ文書の大きさの合計が、この数字を越えると、
一旦索引を書き出す。そうして空にしてから、また次を読む。
この大きさと、必要な記憶域の大きさは、単調増加の関係にある。
(注3)
|
$FILE_SIZE_MAX | 2000000 | これ以上の大きさの譜は無視する
|
$TEXT_SIZE_MAX | 600000 |
これ以上の大きさの文字形式の譜は無視する(フィルタ後)
|
$WORD_LENG_MAX | 128 | これ以上の長さの単語は処理しない(bytes)
|
%Weight | (長いので省略) |
HTML 素子による重み付け点数
|
$INVALID_LENG | 128
| これ以上の長さの文字は重み付けから外す。 <Hn> .. </Hn>
を書体の大小指定だと思っている人がいるため
|
$MAX_FIELD_LENGTH | 200 |
(NMZ.field.* に保存する)文字列の大きさ (bytes)
|
$NKF (*) | "module_nkf" | NKF 起動法
|
$KAKASI (*) | "module_kakasi -ieuc -oeuc -w"
| kakasi 起動法
|
$CHASEN (*) | "module_chasen -j -F '\%m '"
| chasen 起動法
|
$CHASEN_NOUN (*) | "module_chasen -j -F '\%m %H\\n'"
| |
$WAKATI (*) | $KAKASI |
わかち書きに kakase を使うか chasen を使うか | -c, -k |