【コスパ抜群】買い切り音声入力VoiceInk――使い方・購入ガイド

最近は毎週のように新しい音声入力ツールを見かけます。音声入力は戦国時代です。買い切り型VoiceInkをしばらく使ってみて良かったので紹介します。特徴や使い方の他、購入〜アクティベートの手順まで解説します。

※この記事のリンク経由で購入すると筆者にちょっとだけ還元されます。値段は変わらないのでご安心を。

## VoiceInkとは

VoiceInkはオープンソースの音声入力ツールです(GitHubリポジトリ)。特徴を列挙しておきます。
2026年3月10日時点では、デスクトップはMacのみ対応です。

### 買い切りで安め

1週間無料 で一通りの機能が試せます。その後は買い切りプランが3つ用意されてます。2026年3月10日時点での情報を載せておきます。

プラン名値段台数
Solo25ドル1台
Personal39ドル2台
Extended49ドル3台

筆者はSoloを選びました。 音声入力はきっとこれからどんどん進化しそう なので、買い切りは躊躇しちゃいがちですが、(今のところ)3000円台と破格の安さ なので買いました。

### ローカル・クラウド両方対応

「Whisper large v3 turbo」「Macに入っているApple Speechフレームワーク」など、 ローカルモデル を選べます。自分でファイルを用意すれば任意のモデルも使えるようです。

クラウドモデル にも対応していて、Groq・Gemini・Mistral・Sonioxの他、OpenAI互換なら任意のAPIを設定可能です。

#### リアルタイム表示可能

MistralのVoxtral Realtimeのようなリアルタイムに対応しているモデルであれば、リアルタイム表示できます(設定は後述)。

リアルタイム表示だと「ちゃんと認識されているかな〜」というのが分かりやすいです。

### ショートカット設定できる

起動するショートカットは設定できます。 ハンズフリーモードあり なので楽です。

### 日本語出力とアウトプットフォーマット

もちろん日本語出力に対応しています。
音声入力だと丁寧な口調になりがちですが、VoiceInkは アウトプットフォーマットが設定できます 。カジュアルな口調のまま出力できるのが個人的な推しポイントです。

えーなどのフィラー削除にも対応してます(設定で切り替え可能)。

その他、AIに後処理させることもできるようです。

## インストール方法

VoiceInkからダウンロードしてください。

## やってほしい初期設定

使う前に設定・確認してほしいところを書いておきます。

### AIモデル関係の設定

まずAI Models画面を開き、文字起こしの言語を日本語に設定しましょう。
次に、モデル設定です。Multilingualと書かれているモデルを選びましょう。筆者はLarve v3 Turbo (Quantized)を使ってます。

初期設定

#### Output Formatを設定しよう

設定ボタンをクリックし、Output Format右上のEditを押してOutput Formatを編集しましょう。

Output Format設定

ここには 文字起こし後の口調などの例 を短く端的に書きます。

デフォルトは無印良品に通ってそうな丁寧な口調になっています。

こんにちは、お元気ですか?お会いできて嬉しいです。

喋ったときに勝手に口調が変わるのは嫌なので、筆者はカジュアルにしてます。

やっほー、元気?会えて嬉しいよ

※Output Formatはいわゆる「カスタムプロンプト」ではありません。文字起こしモデルに対して「こんな感じで文字起こしお願いね」と伝える例文を書くやつです。224トークン以内という制限があります。

### ショートカットキーの設定

ショートカットキーを設定しましょう。筆者は右Command()にしました。

ショートカットキーの設定

設定した キーを押してすぐ離すとハンズフリーモード となり、再度同じキーを押すまで音声入力できます。
逆にキーを押し続けた場合は「キーを押している間だけ音声入力」となります。

### 許可設定の確認

マイクアクセス許可などを確認しましょう。

許可設定

画面録画のやつは設定しなくても使えます。

## ちょっとずつ辞書設定

使っていく中で誤変換が多いやつは辞書に設定しましょう。Dictonary画面から設定できます。

筆者の登録している例を挙げておきます。

OriginalReplacement
スペックDDspecDD
クロードコードClaude Code
ニックスnix
T-Maxtmux
ティーマックスtmux

GitHubとかは登録して無くても英語でした(文脈によるのかも)。

## リアルタイム表示するならノッチ設定

前述のとおりリアルタイム対応モデルの場合、リアルタイム表示できます。
ただし、 設定からインターフェースをノッチにしないと表示されません

インターフェースをノッチにする

## 有料版の購入・アクティベート

お試しが終わっても使いたい場合は、VoiceInkPricingページからプランを選択し、購入しましょう。
ちなみに楽天カードで払えました。

支払いページ

### ライセンスキーの発行

購入が完了したときのページあるいはemailの指示に従ってライセンスキーを発行します。

### アクティベート

VoiceInk Proからライセンスキーを入力すればアクティベートできます。

アプリ内でアクティベートする

以上、VoiceInkの使い方でした。詳しくは別の記事に書くんですが、 AIとの壁打ち のように頭の中にあるものをバーっと吐き出して 長文書くときに便利 です。

他の音声入力ツールを使うと突然韓国語が混じったりとすることがありましたが、VoiceInkはそういうのが無くて快適です。

精度については、キーボード入力のtypoと同じぐらいの頻度です。よく間違われるやつは辞書登録したり、少しハキハキ話すと良さげです。