Namazu 2.0 入門
 本文書の目的
 2.0.12 版
 簡単・組立済
  NetBSD/pkgsrc
  FreeBSD/Ports
  RedHat Linux/RPM
  Debian
  MacOS X
お急ぎのあなたに
  準備
  configure, make
  make install
  動作確認
始める前に
 mknmz と namazu(.cgi)
 make に必要なもの
 upgrade 更新
  索引の互換性
mknmz
 configure と make
  File-MMagic
  ./configure, make
  make check
 make install 前に
 make install
 --help の表示
 動作確認 mknmz
 URL を合わせる
  --replace
  .namazurc(Replace)
 検索を作る対象
  ~/.mknmzrc での設定
  操作行での指定
 ~/.mknmzrc
  1. 書き方
  2. 位置
  3. .mknmzrc 内変数
 新規と更新
 Filter(前処理)
 各種文書形式
 EXCLUDE_PATH
  最初に | は不可
namazu
 .namazurc
 動作確認
 namazu.cgi
 日本語処理
 環境変数の設定
 --indexing-lang 引数
  環境変数
  日本語表示
  日本語の文字を変える
 型紙(template)のこと
  参照指定 (mknmz)
  参照指定 (namazurc)
  型紙図示
応用編
 項目(field)検索
 複数索引
 窓を付ける
 日記
 Wanderlust
 mhonarc
 表示を自分用に変更
 検索結果の画面を変更
用語
 索引
 kakasi(他)
参照 (URL's)
 他の方の TIPS
その他
 Namazu で出来ること
 出来ないこと
 歴史など
 資源について(準備中)
  最大インデックス
  Out of memory!
  Benchmark
 dbname -> idxname
 チェックポイント機構
 同じ文章を検索対象から外す
 更なる情報源
 うまく行かない
  設置が正しく
  設定
  参照されているか
  索引すべき譜はありません
  FAQ
  情報検索
  バグ追跡システム
  文字化け
 Namazu 採用地点
  番外
  私家版修正
 質問の仕方
  自分の環境を伝えるには
 被参照地点
  UTF-8

Software 入口 | Hardware | NetBSD 解説 | packages | macppc | TsubaiBSD 絹/software/全文検索

資源について(準備中)

どのくらい資源が必要か、 どこに制限があって、 どうやればそれを外せるかという問題

最大インデックス

いま知られている最大のものは すぎうらしろうさんによる
Added Files: 878,914 files
Total Files: 878,914 files
Size: 2,167,480,108 bytes
Total Keywords: 7,339,687 words
Time: 79874 sec.
というもの。一日( 3600*24 = 86400 秒) 以内に終っている。 (File/sec = 11.0) http://www.namazu.org/ml/namazu-ring/msg00961.html
最近では、63M words という例がある(が問題が起きている)
http://www.namazu.org/ml/namazu-users-ja/msg02681.html
[Base]
Total Keywords:      35,476,632
Time (sec):          73,629

[Append]
Added Documents:     101,198
Size (bytes):        1,561,233,316
Total Documents:     225,401
Added Keywords:      27,642,787
Total Keywords:      63,119,419
Time (sec):          129,404
File/Sec:            0.78
合計約 20,000 秒 ということは 2.5 日 ?

Out of memory!

と言われた時の参考に: さいのさんからの情報 メール16万通をmknmzすると Out of Memoryで死ぬ時には swap を増やして見る

Benchmark

一秒間にいくつの譜を処理出来るかを指標としている。
namazu-users-ja 1458 の記事
(実は僕は自分の CPU の番号を間違えている。正しくは PPC 750)
検索

この画面は jeedosaquin を使って表示している。

Last Update: Tue, 22 Apr 2008 21:33:00 GMT 1.1.1.1 2008/03/12