自分の話でなく、他人の話なので丁寧語で。 6月27日にGroongaユーザー勉強会@神戸に参加しました。ブログに書くまでが勉強会だったのを久々に思い出したので、感想書いてみます。
正直あまり回数行ったことがない神戸で、さらに行ったこと無い区域で、さらに入り口に「Closed」と書いてあったので、見事に迷いました。スマホくらい持たないといかんかなー。
で、勉強会の内容は全員の自己紹介の後、@naoa_yさんが、Groongaについて全般的な紹介と事例紹介として特許検索のウェブサービスPatentFieldを紹介する間に、途中気づいた点をどんどん質問していく形式となりました。
LTも時間があればやるはずだったのですが、開始時間が30分遅れたこともあり、出来ませんでした。遅れてすいません><。
以下、色々感想書くと言いつつ、やっぱ感想を書くの苦手なので、自分が気になったポイントを箇条書きで〜
Groonga全般の話
- @ktoさんについに会えた!Twitterでいつも質問してすいません><
- cliで--output_type=xmlとかやると整形をよろしくやってくれる
- dumpよりはgrndumpは今も変わらず。
- PostgreSQLはpg_bgramがいーかも
- データサイズがメモリを超えるくらいでDroonga考えると幸せかも(えーと、今動かしてるサービス、データサイズが余裕でメモリ超えてるんですけど)
- Mroongaは正規化有りがデフォ、Groongaは正規化無しがデフォ。英語は正規化した方がデータサイズ小さくなるよ
- gqtpはこれから非推奨になるかも。
- bigramとmecabのインデックスは同時に使える。インデックスをそれぞれ用意して、mecabの方を重み付けてやると吉
事例紹介の話
- トークナイザとかカスタマイズしてるすげー!
- トークナイザをカスタマイズすることで、検索時間を短縮することが出来る
- 英語の正規化は複数形とかを考えてくれない。
- Groongaの機能全て使いたいから、insertとupdateはMroongaでそれ以外はGroongaを使う
- Groongaメーリングリストは優しい人がいっぱい!積極的に質問していいと思う。
勉強会が終わった後は懇親会に行ってきました。そこで@soundkitchenさんにDocker薦められたので、一回Docker触ってみようと思います。Groonga全然関係ないですね。楽しかったので終電ギリギリまで居ちゃいました。
Groongaは結構使っているんですが、使いこなしてはいないなと思い知らされる点がボコボコ出てくるとても有意義な勉強会でした。次回あればまた参加すると思います! とりあえずこんな感じで。