工作好きな情報系の雑記

[Python]漢字をひらがなに変換してくれるライブラリが結構すごかった

電子辞書を作るにあたって、検索文字列(ひらがな)から該当する語句を探し出すために、語句をひらがなに直しておく必要があった。

手作業でひらがなに直すのは絶望的だと思ってライブラリを探していたら、いいものを見つけた。

pykakasi is re-imprelemtation of kakasi library in Python.
miurahr/pykakasi - GitHub

pipじゃうまくいかなかったので、以下の方法でインストール。

いや~これはすごい。
ある程度なら漢字交じりの日本語をひらがなに変換できる。

しかもひらがなだけじゃなくて、漢字からカタカナとか、カタカナからアルファベットとか、いろいろ柔軟に変換できる。

下の画像では、漢字→ひらがな、漢字→アルファベット、カタカナ→アルファベットの変換をしている。

モバイルバージョンを終了