Topics & News
マピオンラボリニューアルしました。

Mapion マピオンラボ お知らせ Apache Solr 入門 書評

Apache Solr 入門 書評

技術評論社様より献本御礼

こんにちは、坂田です。

現在MapionではSolr使ってます。詳しくは過去のエントリーを参照。

つーことで、今度発売される「Apache Solr 入門」を紹介します。

著者はSolr勉強会でもお世話になっています、株式会社ロンウィット関口さん株式会社NTTデータの武田さんたちです。


-目次- Apache Solr 入門 より

  • Chapter1   イントロダクション
  • Chapter2   スキーマの設定
  • Chapter3   インデックスの作成
  • Chapter4   検索
  • Chapter5   クライアントプログラミング
  • Chapter6   データインポートハンドラ
  • Chapter7   マルチコア
  • Chapter8   分散検索
  • Chapter9   サーチコンポーネント
  • Chapter10  実践! Solr運用TIPS
  • Appendix I   TomcatでSolrを使う
  • Appendix II   Cellとは


スキーマ設定

はい、ここ大事。ここ設計ミスるとホント大変。

最初ハマったのは「indexed="false"」。検索条件には使わないけどソートやファセットするフィールドの場合はtrueにしないといけない。

あとソート専用、ファセット専用フィールドを作るべし。トークナイザで切り出されたインデックスで行われるのでCJKなどでトークナイズしてるとめちゃくちゃな結果が返ってくる。

本書ではフィールド説明から設定に必要なXMLの属性が網羅されているので、まず読むべし、痛い目見る前に(;´∀`)


検索

本書より

サーチコンポーネントを作成することによりSolrの機能を拡張することが可能です。

実際、Mapionでは拡張してます。もちろん緯度経度を使った検索。Solr1.5からは標準機能になるみたいですが。

それにしても本書を読んで改めて思った、いっぱい検索式や機能があることを。

とても全部使い切れん。というか日本語だとうまく機能しないものがあったりと。。。(いや使い方がわかってなかっただけかも)


クライアントプログラミング

ページ数多し、本書全体の1/3近くがこの章です。

解説してある言語。

  • Java
  • PHP
  • Ruby
  • Python
  • Perl
  • JavaScript
  • VLT
Solrは検索エンジンのみです。クライアントプログラミングは必須。フロントサーバ(本書では「変換サーバ」と呼んでいる)の実装は各社違うでしょうから様々な言語で解説しているのは便利かも。


マルチコア・分散検索

Solrの醍醐味ですな~( ´ー`)

分散検索があるからこそSolrを採用したと言ってもいいくらいです。

ちなみにMapionでは70のコア/最大44のシャード数です。これによって、今までRDBではなし得なかったパフォーマンスを手に入れました。

詳細はSolr勉強会の資料を参照。



まとめ

Solrはとにかく日本語のドキュメントがない。。。悲しいくらいに。

本書が唯一の日本語ドキュメントと言ってもいいくらいで、これで敷居が下がりSolrを触ってみようかな~と思う人が多くなればいいですね。

これから説明するのが面倒なときは、この本を渡そう。。。(||´Д`)o=3=3=3 ゴホゴホ

また今回は入門書ですが、まだまだ書き足りないところが多いのではないかと。(実際運用していくと様々な問題もありました。。。)

次はもっとディープなヤツをお願いしてみようかな、第2回 Solr勉強会で。(・∀・)


comment
ニックネーム 
trackback

この記事のトラックバックURLhttp://labs.mapion.co.jp/mtos/mt-tb.cgi/40

Mashup Awards 7 (#MA7)
ユーザーアーカイブ