音声入力を活用している

音声入力の活用

 最近、音声入力を活用しています。音声配信を始めたのですが、そのモチベーションの一つに、音声入力を活用していきたいという思いもあったりします。音声入力の何に魅力を感じているかというと、単純にそのスピードです。

 私はタイピングはそれなりに速い方だと思っていますが、文章を書くとなると、だいたい1時間で3000文字くらいが平均です。これは過去にブログを書くときに、時間と文字数を記録していた時期があって、そのデータに基づいています。今はもう少し書けるかもしれませんが、それでも4000文字は下回るレベルだと思います。

 過去にプロの作家さんの執筆速度を調べたことがあるのですが、だいたい1時間3000文字という人が多く、いわゆるライターさんや商業的に文章を書いている人であれば、3000文字くらいが一つの目安になりそうというのが体感です(データ少ないのでズレはありそうです、そのときはご容赦ください)。

 一方で、トップオブトップの作家として間違いなく挙げられるのが、森博嗣先生です。ミステリー作家で、SFやエッセイも書かれていて、私もかなり好きな作家さんです。森博嗣先生は、めちゃめちゃ書くのが速いことで有名ですが(過去、大学の助教授をやりながら年に10本を超える本を書いていた)。本の中で「1時間6000文字」と言っていました。これは本当に驚異的な速度です。私がタイピングだけに集中して書くときの速度に近いレベルで、ずっと理路整然と文章を打ち続けるわけです。ほぼマシーンですね。

 なお、はてなブログのスターブロガーのフミコ・フミオ氏は、5000文字/時間くらいです(ブログの自己申告を参考に算出)。過去記事にまとめていますので、興味ある方はみてください。

音声入力で森博嗣先生を超える

 正直、私がこのままタイピングを訓練しても、森博嗣先生の域には死ぬまでに到達できないと思います。しかし、ここで音声入力の出番です。私は毎日朝に音声配信の収録をしているのですが、だいたい20分くらいの収録で、文字起こしすると6000から8000文字くらいになります。

 これを1時間に換算すると、×3なので、だいたい2万文字を超える文字数です。もちろん、そのまま全部使えるわけではないので、文字起こししたものを整えたり編集する時間が必要です。それをざっくり半分と見積もっても、1時間で1万文字となります。つまり、音声入力を活用することで、私は森博嗣先生を超える文章生成速度を手に入れる可能性があるわけです。

 これにはすごい可能性を感じます。今までの私基準で考えると、3000文字から1万文字以上になるので、3倍以上の生産性を手に入られることになります。これはチャレンジしないわけにはいきません。

音声入力の重要性

 「文章なんて生成AIに書かせればいいじゃん」という意見もあるかもしれません。ただ、その文章を書かせる生成AIへの指示も何かしら文章でやる必要が当面はあるはずなので、そこでも音声入力は活用できます。

 そして、今の生成AIは文章を一から書かせても、自分の求めるクオリティには正直まだ達しないと感じています。時間の問題かもしれませんが、今は9割くらい直さないと、自分の名前をつけて外に文章を出したくないと思っています。それを考えると、音声入力したものから直した方が、効率としては良いのではないかなと直感的に思っています。今後、実際にどのぐらいの速度でコンテンツが生成できるか、実験して検証していきたいですね。

 あとは、AIに対するあらゆる指示も、音声認識を活用することで手軽にできます。ソフトウェア開発も、音声認識を活用することが増えてきました。ただ、声を出せる環境が必要なところがどうしてもネックですね。

おすすめの音声認識ソフト「Voice Ink」

 ここからは音声入力のための音声認識ソフトの話です(macOS限定の話になります、ご了承ください)。音声認識に使うソフトも最近は色々便利なものが出てきています。有名なものだと有料のAqua Voiceとか、無料のものでもHandyなど複数種類のソフトがあります。ただ、Aqua Voiceはサブスクなのがネックで、無料のソフトは、ワンキーでの音声入力開始と終了の切り替えという基本的なところが、どれも設定できなくてあんまり使いたいものがない状況でした。

 そんな中、私のお気に入りはVoiceInkというソフトです。VoiceInkについて詳細は以下です。

▼VoiceInkの特徴(クリックで詳細表示)

Voice Inkの良いところ

  • 買い切り型: 2ライセンスで39ドル、1万円もせずに購入できる
  • ローカル動作: 音声認識エンジンをローカルにダウンロードして使えるので、クラウド接続不要
  • 操作性が良い: ボタン一つで音声入力ができてストレスフリー
  • 精度が高い: それなりの速度で、それなりの精度(特に問題はないです)

注意点

  • Mac専用

 音声入力ソフトの選定については、以下の記事参考にしました。

 無料のソフトも(貧乏性なので)いくつか試しましたが、Macだとボタン一つで気軽に音声入力できるという基本的なことがストレスなくできるものがなかなかなかったです。できなかったり、精度が悪かったりと不満がありましたが、VoiceInkはそこらへんがストレスなくできるので気に入っています。Macで音声認識ソフトを探している人には、個人的にはおすすめです。

まとめ

 音声認識は、生成AI時代に文章作成からソフト開発まで、幅広く使える基本スキルになるかもしれませんね。ちなみに、この文章も音声配信の素材をもとに音声認識で文字起こしして生成AIで修正したものを使っている…のですが、やはりそのままではダメで、かなり修正したので正直まだそこまで効率的には書けない…というのが正直なところです。

 ただ、音声認識可能性自体は感じているので、今後も音声入力の訓練をしていこうかなと思います。文章を書く機会が多い方は、ぜひ音声入力を試してみると、新しい世界が開けるかもしれません。

関連記事