音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-04 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-04 By logtaka

AMNさん経由でNUANCEさんのイベントに参加してまいりました。

今回、ご紹介のプロダクトはこちら。

ドラゴンスピーチ11
http://japan.nuance.com/dragonspeech/

はい、音声認識のソフトウェアです。

たまたまですが、、、
もう何年も経ちますが、音声認識のソフトウェアの検討をする機会があって、ドラゴンスピーチも某社のソフトウェアも含めて何種類かの検証、、というほどでも無いですが、比較検討をしたことがありました。
あれから何年も経っていますので、状況はかなり変わっていることを期待しています。

AMNブログ
世界シェアNo.1の音声認識・音声入力ソフト「ドラゴンスピーチ11」ブロガーミーティングを開催しました!
http://agilemedia.jp/news/event/20140528_dragonspeech.html

会場は外苑前のイベントスペースにて。
見知った顔の方も含めて皆さん揃っていました。
いつもベーシックに美味いFungoさんのサンドイッチをぱくつきつつ、周りの皆さんと軽くブレイクを(笑
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-01 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-01 By logtaka

マーケティング担当の会社の方が説明していましたが、こちらを御覧ください。


続いて、
あれ?っと、思ったら堀さんが登場しました。
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-02 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-02 By logtaka


Lifehacking.jp
http://lifehacking.jp/
 の堀さん

堀さんから音声認識でブログを書く可能性についてお話を頂きました。
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-03 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-03 By logtaka

堀さんがやられる際には、車の中でスマートフォンなどに音声入力させて、後でファイルで読み込ませる事をしているそうです。

(え−。堀さんMacユーザーなはずなんだけどーw
 って、後で聞いたら、Surface Pro3に触手が動いてるとかw)

このざっくり録音 修正 は、確かに楽かもなーって思いますけどね。

そして、
あれ?っと、思ったら和田さんが登場しました。
WADA-blog
http://wadablog.com/ の和田さん

前に沖縄にご一緒しましたね^^

和田さんの素敵なお声を認識させる実演をされていましたが、ほっとんどトレーニングしていないにも関わらずかなりの認識率で驚きましたね。



■良いと思った点
なかなか良いなーって思ったところはこの辺ですかね。
  • 圧倒的な認識率!
  過去の認識率に比較すればトレーニング次第ではありますが圧倒的に向上してますね。
  • 音声ファイルも認識可能
  既存のICレコーダーとか、iPhoneのボイスメモファイルも利用可能。
  • 音声の文字化のみではなく、PCの操作を行う事も可能
  ある程度、事前の準備も必要かとは思うけど出来る事はわりとあるかも。
  • Facebook、TwitterについてはPost用のコマンドがビルトイン
  機能的には単純化した程度だとは思うけど実況系Postなど用途はあるかも。
  • コマンドエディタによる操作で独創的で多彩な操作可能
  使い方は無限大ってことね。
  • 短縮入力などもファイル(CSV的なフォーマット)で一括登録可能
  こちらもコマンド操作と考え方は一緒かも。

■期待したい点
残念だなーと思うのは、
  • 稼働プラットフォーム
  今のところ(たぶんしばらくは)Win系OSのみです。(7、8、8.1)
  • トレーニングが大切
  正直ソコが大変なのよね。
  • 他の音声認識との比較
  SNSで少し他の方からも言われたのですが、SiriやGoogle音声認識など
  他の音声認識ソリューションの認識率が非常に高い今、
  このアプリケーションの様にトレーニングが必須で、
  コストもかかるところはどうなんだろう?

という印象ですね。

今回のイベントに参加して、こちらのアプリケーション(+ヘッドセット)をモニター頂きました。
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-05 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-05 By logtaka


とりあえず、6月の第一水曜日にマンスリーハンバーガーTVオンエアをするので、そこでヘッドセットは使ってみようかな(笑
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-06 By:logtaka
Photo:2014-05-28_T@ka.'s Life Log Book_【Event】音声認識技術もココまで来たかー!の驚きだったイベントに参加してみました。-06 By logtaka