Emily Tan
2017年11月13日

アマゾンが音声認識技術に多額の投資をする理由

これまでのコンピューターは人間的でない不自然なやりとりが必要で、使う人を選ぶインターフェースだったと、アマゾンの最高技術責任者(CTO)ワーナー・ヴォーゲルズ氏は語る。

アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏
アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏

「これまで、全てのコンピューターは人間とでなく、コンピューターと対話するように設計されていました」と、ヴォーゲルズ氏は先週開催されていたウェブサミット(リスボン)でコメントした。

「そのため、人間的でない不自然なやりとりを強いられ、使う人を選ぶものでした」

同氏は、マニラの国際稲研究所(IRRI)の例を挙げる。「この研究所ではコメ生産に関するさまざまな研究を行い、生産量を伸ばすための取り組みを地元の農家と進めてきました。まず、重要な情報を網羅したウェブサイトを作成したのですが、農民がコンピューターを持っていなかったため、活用されませんでした。そこで、農民が自分の畑について音声で調べられるよう、音声技術を導入したところ、生産量が大きく伸びたのです」

また、スマートスピーカー「アマゾンエコー」の購入者がとても満足していることが、商品レビューからも見てとれると同氏は語る。「手軽に使えるため、日常のあらゆる雑務に活用しているようです」

ある認知症患者によると、アマゾンの音声アシスタント「アレクサ」を使うことで記憶が戻ったという。今日の日付を一日に20回聞いたとしても、怒ることなく正解を教えてくれるためだ。

ただしアマゾンの本命は、エコーのみではない。「エコー自体はまだそれほど賢くなく、クラウド上に構築された人工知能があってこそ」とヴォーゲルズ氏。「アレクサの音声サービスは、あらゆる処理をこなすプラットフォームによって支えられているのです」

ブランドや開発担当者は、アレクサスキル(アレクサに対応するプログラム)のキットでスキル開発をせずとも、リアルな音声合成サービス「アマゾンポリー」を活用することができる。

「ポリーはテキストを音声に変換するフルマネージドサービスで、47種類の声で、24の言語に対応しています。Duolingo(語学学習アプリ)にも、ポリーが使われています」

ポリーは声の種類、音量、文脈、発音などをコントロールすることができる。ヴォーゲルズ氏は実演して見せながら「ポリーを使えるのはアレクサだけでありません。音声によるチャットボット(対話ボット)を作成することもできるのです」と語った。

このような技術開発にアマゾンが投資するのは、人間的なインターフェースの導入がデジタルの未来を左右すると考えるためだ。

「音声認識技術をデジタルシステムに導入することで、システムの構築に大きな変革をもたらすと考えています」とヴォーゲルズ氏。「そして、デジタルネイティブではない全ての人にも、広く門戸を開くものと信じています」

(文:エミリー・タン 翻訳・編集:田崎亮子)

提供:
Campaign UK

フォローする

トップ記事と新しいキャンペーン情報

速報メールを受け取る

関連する記事

併せて読みたい

Premium
エージェンシー・レポートカード2018: ADK
Premium
1 日前

エージェンシー・レポートカード2018: ADK

組織再編に力を入れるADKは、数々のすぐれたクリエイティブを制作。従来型の収益モデルからの脱却を目指すイニシアチブも発揮してきた。

Premium
世界マーケティング短信:ソレル卿の回帰案
Premium
1 日前

世界マーケティング短信:ソレル卿の回帰案

今週も世界のマーケティング界から、注目のニュースをまとめてお送りする。

Premium
セレブリティー、ブランド、麻薬
Premium
1 日前

セレブリティー、ブランド、麻薬

ピエール瀧容疑者逮捕の事件で、ブランドは改めて倫理観を問われている。

Premium
JAL、グローバルマーケティング部を新設
Premium
4 日前

JAL、グローバルマーケティング部を新設

2020東京五輪を見据え、日本航空がグローバルマーケティングを強化する。