Open7
検索エンジンを自作したい
業務で検索エンジンを実装する必要がてきた。自前で実装するべきか、SaaSに乗っかるか、色々考えているので参考にしたサイトなどをまとめていきたい。
そもそも検索エンジンの仕組みについて
兎にも角にも、この本に目を通しておいても損はない。
検索エンジンの構築の章では、検索エンジンの根本的な原理説明から始まり、Pythonを用いた実装例を示してくれる。
検索の文脈で「検索インデックス」というキーワードが出てくるのは、RDBの検索特性をうまく活用してできていることがよくわかる。とても良書。
また、シンプルな検索エンジンの先にはPageRankなどのGoogleの検索エンジンに用いられるチューニングについての解説もある。
この本を読めばまずは概要と設計の方針についてはある程度の理解が得られるだろう。
実際の実装例に関する記事
単純に文字列を分割して、キーワードで引っ掛かるようにしている。
生Firebaseの高速な検索能力を活用している面白い実装例。
各種サービスの選定に役立ちそうな記事
資金的に厳しいスタートアップにはAlgoliaの起用は絶望的であるとよくわかる良い記事
※ ただし、現在は価格が下がって比較的状況は良くなっている模様
https://qiita.com/Michinosuke/items/d618a297373682bf4dd5
ElasticSearch と Algolia の比較 (マナリンクさん、いつもお世話になっています)
まだ読んでいないが、参考になりそう
ElasticSearchの価格シミュレーター(本家)
手始めにサクッと、Algoliaで検索機能を作って、費用的に厳しそうになったらすぐにElasticsearchに乗り換えるのが良いのかもしれない。
Algoliaの従業員(真偽は不明)によるAlgoliaの解説ブログ。情報量が多く良い。
Apache Solr