本日(2010/10/30)は私の所属する化学工学教室の同窓会(洛窓会)の総会、講演会、懇親会がありました。講演会では3人の方にお話いただきましたが、特に印象に残りましたアドバンスト・メディア社長の鈴木清幸氏のご講演について書きたいと思います。
講演題目 ソフトコミュニケーションの時代へ ~ 人中心のコミュニケーションの実現 ~
鈴木氏は人工知能による音声認識ソフトを開発販売する会社(
http://www.advanced-media.co.jp/company/index.html)の社長をされている方です。
音声認識ソフトといえば、Microsoft WORDやWindows Vistaにも搭載されており、それほど珍しいものではないと思っていたのですが、アドバンスト・メディア社が開発しているAmiVoiceは事前にソフトに学習させる必要が無く、いきなり高い認識精度で音声をテキストに変換できるそうです。また、PCというキーボードやマウスが主体の入力デバイスが使えない、携帯電話や医療現場、工事現場などで端末に話しかけるだけで文章が作成できる状況を想定してシステムが作られています。
ご講演を拝聴していて面白いなと感じたところは、単なるソフトウェアベンダーではなく音声認識ソフトを核としたビジネスモデルを構築しているところです。
ビジネスモデルの中核にあるのは、人中心のソフトコミュニケーションという考え方で、人間の自然な動作によりコンピュータを操作しコンピュータに補助をさせるという考え方のようです。
アドバンスト・メディアのホームページにも同じ内容が紹介されていますが、音声認識ソフトを使って、議会の議事録を作成したり、保険のコールセンターの支援システムを作成したり、お医者さんのカルテや所見などを入力する補助をしたりするシステムが構築されています。それぞれの専門分野ごとに専門用語が異なるので、分野ごとに特化した辞書を用意することで変換効率を高めて実用化しているようです。お医者さんのシステムでは、お医者さんがこれまでキーボードに入力していたよりも早く入力できるようになり、残業が無くなり、より多くの患者さんを診察できるようになったとか。
保険のコールセンターの支援システムでは、コールセンターの人が正確な表現で保険の内容を説明しているかどうかを監視したり、契約の際は、言い忘れがないように、画面上にまだ説明していない内容が表示されていたり、お客様に住所や電話番号の入力を求めるときは、会話の内容がその部分に移った際に、会話の内容を音声認識ソフトが自動的に理解し、画面に表示するなどのデモを見せていただきました。
これからのビジネスターゲットは、医療・介護だそうです。介護従事者は介護保険ための膨大な書類作成があり、実際の介護以外の事務作業に忙殺されているようです。この作業を音声認識ソフトによる音声→テキストの変換と、変換されたテキストの人間による修正と、音声を発した人の承認により、介護従事者がキーボードをたたかなくても書類が作成できるシステムをオンライン(ASP)で構築するようです。
他にも、日本語で携帯情報端末に話しかけると英語で翻訳した内容がしゃべり出されるなど、お~と思わされるような技術でした。
音声認識ソフトという核がしっかりしているからこそできるのでしょうが、自分たちの技術をいかにしてビジネスに結びつけるかというアントレプレナーならではの発想と行動力を感じた講演でした。技術とビジネスが結びつかないとやっていておもしろくないですものね。
まだまだ音声認識ソフトは進化していくのでしょうが、チューリングテストにパスする人工知能が生まれる日も近いのでしょうか。そんな人工知能に、漫才の一つでもしてもらいたいものです。
以下のソフトは万人向けに作られているので、特化したアプリケーションのものよりは認識率は低いと思われますが、ご紹介します。