Mapion マピオンラボ お知らせ Apache Solr 入門 書評
技術評論社様より献本御礼
こんにちは、坂田です。
現在MapionではSolr使ってます。詳しくは過去のエントリーを参照。
つーことで、今度発売される「Apache Solr 入門」を紹介します。
著者はSolr勉強会でもお世話になっています、株式会社ロンウィットの関口さんや株式会社NTTデータの武田さんたちです。
-目次- Apache Solr 入門 より
- Chapter1 イントロダクション
- Chapter2 スキーマの設定
- Chapter3 インデックスの作成
- Chapter4 検索
- Chapter5 クライアントプログラミング
- Chapter6 データインポートハンドラ
- Chapter7 マルチコア
- Chapter8 分散検索
- Chapter9 サーチコンポーネント
- Chapter10 実践! Solr運用TIPS
- Appendix I TomcatでSolrを使う
- Appendix II Cellとは
スキーマ設定
はい、ここ大事。ここ設計ミスるとホント大変。
最初ハマったのは「indexed="false"」。検索条件には使わないけどソートやファセットするフィールドの場合はtrueにしないといけない。
あとソート専用、ファセット専用フィールドを作るべし。トークナイザで切り出されたインデックスで行われるのでCJKなどでトークナイズしてるとめちゃくちゃな結果が返ってくる。
本書ではフィールド説明から設定に必要なXMLの属性が網羅されているので、まず読むべし、痛い目見る前に(;´∀`)
検索
本書より
サーチコンポーネントを作成することによりSolrの機能を拡張することが可能です。
実際、Mapionでは拡張してます。もちろん緯度経度を使った検索。Solr1.5からは標準機能になるみたいですが。
それにしても本書を読んで改めて思った、いっぱい検索式や機能があることを。
とても全部使い切れん。というか日本語だとうまく機能しないものがあったりと。。。(いや使い方がわかってなかっただけかも)
クライアントプログラミング
ページ数多し、本書全体の1/3近くがこの章です。
解説してある言語。
- Java
- PHP
- Ruby
- Python
- Perl
- JavaScript
- VLT
マルチコア・分散検索
Solrの醍醐味ですな~( ´ー`)
分散検索があるからこそSolrを採用したと言ってもいいくらいです。
ちなみにMapionでは70のコア/最大44のシャード数です。これによって、今までRDBではなし得なかったパフォーマンスを手に入れました。
詳細はSolr勉強会の資料を参照。
まとめ
Solrはとにかく日本語のドキュメントがない。。。悲しいくらいに。
本書が唯一の日本語ドキュメントと言ってもいいくらいで、これで敷居が下がりSolrを触ってみようかな~と思う人が多くなればいいですね。
これから説明するのが面倒なときは、この本を渡そう。。。(||´Д`)o=3=3=3 ゴホゴホ
また今回は入門書ですが、まだまだ書き足りないところが多いのではないかと。(実際運用していくと様々な問題もありました。。。)
次はもっとディープなヤツをお願いしてみようかな、第2回 Solr勉強会で。(・∀・)

-
この記事のトラックバックURLhttp://labs.mapion.co.jp/mtos/mt-tb.cgi/40





