日々の開発で AI と壁打ちしながら考えを詰めていく時間が、いつの間にか普通の作業工程になっています。そんな中でぱっと浮かんだイメージを形にするには、キーボードを叩くよりも口に出してしゃべった方が明らかに早く効率的な場面が少なくありません。
そこで手元だけで完結する日本語音声入力ツールが欲しくなり色々探したのですが、Windows でそれをやろうとすると、クラウド系のSaaSが多く、ローカルで高精度に音声認識が可能で個人の音声入力に特化したものとなるとほとんど見当たりません。結局「無いなら作れ」のエンジニアの鉄則に従い、音声認識→文字入力だけに絞り込んだ、完全ローカル動作のシンプルなデスクトップアプリを作りました。
名称は Kotoba-Jot、日本語特化の音声認識モデル kotoba-whisper-v2.0 を組み込み、Windows を主眼に据えつつ、同じ発想で macOS (Apple シリコン / Intel) にも対応させています。対話 UI や AI アシスタント的な機能は一切なし、「話す → 入力フォーカスに文字が流し込まれる」という一点に振り切ったアプリです。GitHub Releases から v0.1.6 を無料で取得できます。







