📣

もしかしてまだキーボード使ってる?AI駆動の音声入力ツールSuperWhisperをオススメしたい

2025/02/14に公開

皆さん、音声入力って使ったことありますか?

いつもパソコンのキーボード入力で作業してると、実は結構遅かったり、面倒だったりすることってありますよね。特に、最近はAIにプロンプトを投げるときなんかは文章量が長くなりがちでめんどくさい...ってなることが自分は多いです。
そこで、最近自分が試してみたのが「SuperWhisper」というサービスです。MacとiOS向けのアプリで、Apple純正の音声入力と比べてもかなり使いやすいんです。ちなみに、この文章自体もSuperWhisperを使ってほぼ文字起こししたものをOpenAI-o3で整形してもらって作っています!(せっかくなので最後に文字起こしもままで貼っています)


SuperWhisperってどんなツール?

簡単に言うと、AIを活用した音声認識モデルを搭載していて、MacやiPhoneでサクッと音声入力ができるツールです。15分間の録音までは無料で使えるみたいなので課金せずに始められます。以下、自分が注目しているポイントをいくつか紹介しますね。

https://superwhisper.com/

1. 認識精度がマジでスゴイ!

100以上の言語に対応していて、日本語もキレイに整形してくれます。
雑音や早口、専門用語にも対応していて、話した言葉が自然なテキストに変換されます。
さらに、テキストはクリップボードにコピーされて、すでに入力欄にカーソルがあたってれば自動で貼り付けられます。

2. オフラインでも動作!

ネットに繋がってなくてもローカル環境で音声認識ができるので、プライバシー面でも安心。ただ、自分はまだ試していないので詳細はこれからかな~と思っています(ローカルの場合は流石にLLMを使っていないと思われるので性能は変わりそう...)。

3. 用途別にモデルが設定できる

用途別にモデルが設定できて、アイデアのメモ、文章作成、メール返信、議事録作成、AIへのプロンプト入力、自分自身でモデルをカスタムで設定することも可能みたいです。

4. 柔軟な辞書機能で専門用語も楽々

あらかじめ特定のフレーズや単語を登録しておくと、音声入力時に自動で変換してくれるんです。
例えば、Slackのメンションとか、専門用語や特殊記号もバッチリ入力できる仕様になってます。


自分がSuperWhisperにハマった理由

AIのプロンプト入力が超効率化!

長いプロンプトをキーボードで打つのって面倒ですよね。
でも、話した内容がそのままテキストに変換されるので、思考の流れを止めずにすぐAIに指示を出せるのがめちゃくちゃ便利!
最近のAIは、直感的な指示にもちゃんと対応してくれるので、音声入力との相性は抜群です。

コーディングでも使える!

普段、Cursorというエディターでコードを書いてるのですが、
AIにコード生成を頼むときも、あらかじめ設定した変換パターン(ファイル名やデータ型等)を使って、音声で直接メンションできるのが最高です。
タイピング中心の作業から一歩進んだ、新しい開発スタイルが来る予感がしています。

ショートカットでさくっと呼び出し!

さらに、ショートカット設定をすれば、たとえば「Ctrl+Z」でSuperWhisperが起動。(デフォルトは「Option + Space」ですが、地味に遠いので変えました笑)
何か音声でテキスト入力したいときに、即座に録音が始まるので、すぐに使えるのが良いですね。


まとめ

SuperWhisperは、従来のタイピング中心の作業スタイルを大きく変える、魅力的な音声入力ツールでした。無料で始められますが、課金体系はサブスクと買い切りのモデルとかもあるみたいです。
長いプロンプトや専門的なコマンド操作にも、他のツールとは違い特に音声入力でよくあるなんか違う...の違和感がなく使い続けられる印象です。プログラミングで音声入力を使う人はまだ少ないかもしれませんが、Vimとかと比べるとどっちが早いんですかね〜

普段の作業で「もうちょっと楽に指示出せたらな~」と思っているエンジニアやクリエイターの皆さん、ぜひ一度SuperWhisperを試してみてください!ただ、電車の中だったり、カフェで使うとヤバいやつ確定なのでそこは音声入力の限界ですね...笑

以上、SuperWhisperの魅力をざっくりとお伝えしました。皆さんの作業スタイルがもっと快適になることを願ってます。

文字起こし

皆さんはそもそも音声入力って使ったことありますか?いつも当たり前のように作業してるパソコンのキーボード入力って実は結構遅かったりするんですよね特にAIにプロンプトを投げるときなんて結構文章量が長くなったりしませんかね最近自分はそこのちょっと面倒くささから音声入力のキーボード入力の代わりに音声入力を試していたりするんですけど最近見つけたのがこのsuperwhisperっていうサービスですこれ今macとiOSのアプリで作られているサービスらしくてこれはAppleの純正の音声入力機能だったりとかと比べるとかなり使いやすかったので今回紹介していきたいと思いますなおこの文章自体もこのsuperwhisperのツールを使ってほぼ文字起こしで作成されています

スーパーの説明をまずするとAIを使った音声認識モデルでMacやiPhoneで手軽に利用できる音声入力ツールらしいですと以下の点が結構注目されているみたいで一つ目がまず認識精度がすごい早い雑音だったり早口専門用語にも対応できる話した言葉はほぼリアルタイムにテキストにしてくれてクリップボードにコピーそのまま何かすでに入力欄とかにカーソルが当たってたらそのまま貼り付けされていますあともう二つ目がオフラインでも動作できるらしくてこれは僕は試してないんですけどローカル環境で音声認識を行うことができるんでネットワーク使わずに利用することができるんでプライバシーも安全とただこれは既存のLLMのモデルを連携してないんじゃないかなって推察しています三つ目が他言語対応でもちろん日本語を含む100以上の言語に対応しているらしくて日本語の文章も結構美しく整形されるんでアイデアの記録だったりとかこういう文章の作成だったりとかメッセージの返信なんかにも使えるみたいですとあとAIの指示とかプロンプトを打つときにも使ってもいいですよね
あと4つ目が柔軟な辞書機能といって特定のフレーズだったり単語とかをあらかじめ設定しておくと音声入力時に自動的に変換してくれるらしいんですよなんで専門用語とか特殊記号も入力ができるっていうのは仕様になっているみたいです例えばスラックのメンションするときにスラックなんとかって言ったらスラックのメンションのフォーマットに自動で変換してくれるみたいなことも紹介されていました

自分がこれめっちゃいいなと思ったポイントがAIのプロンプトの入力を効率化させるっていうところが結構すごく便利だって思ってましてやっぱ生成AIに長部のプロンプトを入力するときにやっぱキーボードのタイピングだとめちゃめちゃ手間がかかっちゃうんでそこをもう話した内容がそのままテキストに変換されて思考の流れを止めることなく声でAIに指示を出してフィードバックをしてもらうっていうところがすごく便利になったなと思ってますしやっぱ直感的に話すだけでも最近のAIって結構意図を汲み取ってくれるぐらい能力が向上してたりするんでAI利用にはすごく最適だなと思ってます
自分はカーソルっていうエディーターを使ってコードを書くことが多いんですけどそこのコードでAIに生成してもらうときもいくつかの変換パターンみたいなのを用意してそれでAIに音声入力で直接コミュニケーションを取れるのがすごく便利だなと思っています

あともう一点が結構簡単に呼び出せるんでショートカットの設定をすれば自分はControlとzコマンドで勝手にパソコンでこのsuperwhisperが開くようなショートカットを設定しているんで何か音声でテキストを入力したいときはそのコマンドを打てば勝手に録音が開始されるという形に設定することも可能ですと

まとめなんですけど superwhisperは従来のタイピング中心の作業スタイルを大きく変える音声入力ツールになっていて特に長いプロンプトの入力だったりとか専門的なコマンド操作において他の音声入力ツールとは結構違ったメリットが多くあるなと感じました特にプログラミングコーディングするときにこの音声入力を使うというやり方をしている人ってあんまりいないんじゃないかなと思うんですけどVimとか使うのとどっちが入るのかというのは若干個人的には気になってますという話ですね普段の作業でもうちょっと楽に指示出したらなと思っているエンジニアの皆さんはぜひ使ってみてもらえると面白いかなと思うんでぜひご自身の開発タイルに新しい可能性を見出してもらえるような方で嬉しいですただ1個だけちょっと気になっているのがこれ外とかカフェとかで使えないというところだけで若干気になってますねわら

Discussion