電子辞書を作るにあたって、検索文字列(ひらがな)から該当する語句を探し出すために、語句をひらがなに直しておく必要があった。
手作業でひらがなに直すのは絶望的だと思ってライブラリを探していたら、いいものを見つけた。
pykakasi is re-imprelemtation of kakasi library in Python. miurahr/pykakasi - GitHub |
pipじゃうまくいかなかったので、以下の方法でインストール。
1 2 3 |
$ git clone https://github.com/miurahr/pykakasi.git $ cd pykakasi $ python setup.py build install install_lib |
いや~これはすごい。
ある程度なら漢字交じりの日本語をひらがなに変換できる。
しかもひらがなだけじゃなくて、漢字からカタカナとか、カタカナからアルファベットとか、いろいろ柔軟に変換できる。
下の画像では、漢字→ひらがな、漢字→アルファベット、カタカナ→アルファベットの変換をしている。