MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

MySQL

2016-09-14 18:44 (7年前) ytyng

まったく定量的な話でないのですが。

某サービスで、MyISAM のテーブルのフィールドにフルテキストインデックスをつけて、バイグラムで検索インデックスを入れてました。20万レコードぐらい。

今までは、そのフィールドの文字コードの照合順序 ( collate ) は utf8_general_ci (デフォルト) だったんですが、日本語でカタカナ平仮名両方マッチさせたいので、collate を utf8_unicode_ci に変えてみたんです。

そうしたら、パフォーマンスが極端に悪くなり全然サービスが動かなくなってしまって。SHOW FULL PROCESSLIST; 見たら検索クエリが詰まってる。

ということで、utf8_unicode_ci やめて元に戻しました。日本語のカタカナ平仮名のゆれは、検索データを入れる際にノーマライズして入れることにしました。

utf8_unicode_ci やめといたほうがいい、という話。というか検索系は MySQL + フルテキストインデックスでやるより、Elasticsearch とか Cloudsearch とか使ったほうが良いですね。

MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

MySQL

2016-09-14 18:44 (7年前) ytyng

コメント

最近の投稿

カテゴリー

著者

フィード

アーカイブ

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

MySQL の 照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

MySQL 2016-09-14 18:44 (7年前) ytyng

コメント

最近の投稿

カテゴリー

著者

フィード

アーカイブ

2024

2023

2022

2021

2020

2019

2018

2017

2016

2015

2014

2013

2012

2011

MySQL の照合順序 utf8_unicode_ci はけっこう遅いのでやめとくべき

MySQL

2016-09-14 18:44 (7年前) ytyng