VoiceInkの文字起こしをもっと読みやすく!AI整形のすすめ
音声入力ツールとしてVoiceInkを使ってます。3000円台の買い切りなのでコスパ良かったのが理由です。
初期設定でも問題は無い のですが、「句読点が挿入されず、後から読み返すときに読みづらいなぁ」ということが たまに ありました。
そこで本記事では、Enhancement機能を使って「文字起こし後に文章を読みやすく整形する方法」を解説します。
すでに別の記事で使い方・購入ガイドは書いてますので知らない人はこちらを先にご覧ください。
※この記事のリンク経由で購入すると筆者にちょっとだけ還元されます。値段は変わらないのでご安心を。
## Enhancement機能とは
Enhancement機能は「文字起こし後に、別のAIがひと手間加えてくれる機能」です。今回の目的である「整形」のほか、普通のチャットのように質問に答えてもらったりできます。筆者は整形用に使ってますが、質問に答えされたり翻訳向けにもできます。
## 設定手順
ここから具体的な設定手順です。
### AIのAPIキーを取得する
まずはEnhancementで使うAIのAPIキーを用意します。
筆者は無料で使えるGoogle AI StudioのGeminiを使ってます。無料枠でこの1か月問題なかったです。
#### GeminiのAPIキーの作成
GeminiはGoogle AI Studio APIキーから作成できます。

作ったらコピーしてクリップボードにいれます。

#### Geminiの無料枠はどれくらいか
2026年4月11日時点で筆者の管理画面だと、Gemini 3.1 Flash Lite Previewの無料枠は次のとおりでした。
| レート制限項目 | 上限値 | 筆者のケース |
|---|---|---|
| 1日あたりの最大リクエスト数(RPD) | 500 | 多くても40。だいたい20以下 |
| 1分あたりの最大リクエスト数(RPM) | 15 | 多くても4。だいたい1か2 |
| 1 分あたりの最大入力トークン数(TPM) | 250K | 多くても4.06K |

#### Geminiを使う時の注意点
無料枠や制限は変わる可能性大です。また、新しいモデルが出ると古いモデルの無料枠が無くなるようです。
レート制限に引っかるような使い方をしてないのに「レート制限に引っかかりました」みたいなエラーになった場合、新モデルが出てないかを要チェックです。
### Enhancementを設定する
VoiceInkからEnhancement画面を開きます。
#### プロバイダー設定
Enableにして、プロバイダー設定で各自が使いたいAIを指定しましょう。
さきほど入手したAPIキーはAPI Keyに貼り付けます。

#### プロンプト設定
次に、Enhancement Prompts欄の右上のプラスマークを押し、プロンプトを追加します。

自分にとって分かりやすい名前・説明を付け、Instructionsに処理してほしい内容を書きます。

筆者のプロンプトは次のとおりです。
あきらかな言い間違いを削除し、適宜句読点や改行を入れてね。ユーザーの入力は「別のAIに渡すためのプロンプト」なので、話した通りに日本語で出力してね。
以下は禁止。- 口調の変換- 翻訳- 質問や要望に答える
## 例ユーザー:ユーチューブのキーワード検索のAPIについて調べてほしい。よろしく正解例:YouTubeのキーワード検索のAPIについて調べてほしい。よろしく
禁止例- 「YouTubeのキーワード検索のAPIについて調べてほしいです。よろしくお願いします」(口調をですます調に変更してしまってる。**口調の変更は禁止**。勝手に丁寧な口調に変換しないこと)- 「分かりました。YouTubeのキーワード検索のAPIを調べますね。表形式でパラメータをまとめます」(要望に答えてしまってる)
長めの文章は適宜改行を入れて読みやすくするのはアリ。口調変更は禁止CLIPBOARD_CONTEXTやCURRENT_WINDOW_CONTEXTの出力は不要#### プロンプトの補足
前述のプロンプトの成り立ちも書いておきます。
「言い間違い削除、句読点・改行挿入」は 整形目的 ですね。
たまに「〇〇してください」という発言に対してそのままEnhancementのAIが回答しちゃいます。自分は単にClaude Codeなどにお願いする用のプロンプトなどを書きたいだけなので不要です。
なので 勝手に回答せず、整形だけに専念するよう念押し してます。
口調が勝手に書き換わってしまうことがあるので、 口調はそのままを維持 するようにしてます。
あとVoiceInkが内部で渡すパラメータCLIPBOARD_CONTEXT・CURRENT_WINDOW_CONTEXTを吐き出してしまうこともあったため、出力しないようにしてます。
#### 各自カスタマイズ
紹介したプロンプトはあくまで筆者の使用用途に合わせたものです。
「よく翻訳してます」「めっちゃメール書きます」という人は、それに応じてプロンプトの内容を変えてみてください。
プロンプトの内容が思いつかない人は、ChatGPTなどAIに相談しましょう。
最初は単に句読点の挿入だけの目的でしたが、カタカナ語をうまい具合に英語に変換してくれたりするので 辞書や置換機能への登録が減って楽 になりました。うれしい副作用です。
一方で、GeminiのAPIでたまに遅いのがネックです。