Emily Tan
2017年11月13日

アマゾンが音声認識技術に多額の投資をする理由

これまでのコンピューターは人間的でない不自然なやりとりが必要で、使う人を選ぶインターフェースだったと、アマゾンの最高技術責任者(CTO)ワーナー・ヴォーゲルズ氏は語る。

アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏
アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏

「これまで、全てのコンピューターは人間とでなく、コンピューターと対話するように設計されていました」と、ヴォーゲルズ氏は先週開催されていたウェブサミット(リスボン)でコメントした。

「そのため、人間的でない不自然なやりとりを強いられ、使う人を選ぶものでした」

同氏は、マニラの国際稲研究所(IRRI)の例を挙げる。「この研究所ではコメ生産に関するさまざまな研究を行い、生産量を伸ばすための取り組みを地元の農家と進めてきました。まず、重要な情報を網羅したウェブサイトを作成したのですが、農民がコンピューターを持っていなかったため、活用されませんでした。そこで、農民が自分の畑について音声で調べられるよう、音声技術を導入したところ、生産量が大きく伸びたのです」

また、スマートスピーカー「アマゾンエコー」の購入者がとても満足していることが、商品レビューからも見てとれると同氏は語る。「手軽に使えるため、日常のあらゆる雑務に活用しているようです」

ある認知症患者によると、アマゾンの音声アシスタント「アレクサ」を使うことで記憶が戻ったという。今日の日付を一日に20回聞いたとしても、怒ることなく正解を教えてくれるためだ。

ただしアマゾンの本命は、エコーのみではない。「エコー自体はまだそれほど賢くなく、クラウド上に構築された人工知能があってこそ」とヴォーゲルズ氏。「アレクサの音声サービスは、あらゆる処理をこなすプラットフォームによって支えられているのです」

ブランドや開発担当者は、アレクサスキル(アレクサに対応するプログラム)のキットでスキル開発をせずとも、リアルな音声合成サービス「アマゾンポリー」を活用することができる。

「ポリーはテキストを音声に変換するフルマネージドサービスで、47種類の声で、24の言語に対応しています。Duolingo(語学学習アプリ)にも、ポリーが使われています」

ポリーは声の種類、音量、文脈、発音などをコントロールすることができる。ヴォーゲルズ氏は実演して見せながら「ポリーを使えるのはアレクサだけでありません。音声によるチャットボット(対話ボット)を作成することもできるのです」と語った。

このような技術開発にアマゾンが投資するのは、人間的なインターフェースの導入がデジタルの未来を左右すると考えるためだ。

「音声認識技術をデジタルシステムに導入することで、システムの構築に大きな変革をもたらすと考えています」とヴォーゲルズ氏。「そして、デジタルネイティブではない全ての人にも、広く門戸を開くものと信じています」

(文:エミリー・タン 翻訳・編集:田崎亮子)

提供:
Campaign UK

関連する記事

併せて読みたい

1 日前

世界マーケティング通信:トランプに異を唱えるブランド、ワッツアップへの逆風

今週も世界のマーケティング界から、注目のニュースをお届けする。

1 日前

クリエイティビティと効果の関係

クリエイティビティと効果向上は手を取り合う必要があると、マッキャン・ワールドグループ(McCann Worldgroup)のグローバルプレジデント兼最高戦略責任者は語る。

1 日前

プライバシー保護法がネット広告を規制する時代

EUのGDPR(一般データ保護規則)をはじめとするプライバシーに関する法律は、コンプライアンス部門に任せきりにすべきではない。インターネット広告に力をもたらすデータ収集の慣行こそが、プライバシー保護規制の焦点であり、マーケターも留意する必要がある

2021年1月08日

世界マーケティング短信:ネットフリックスの日本向けキャンペーン、過労死で揺れる中国テック業界

2021年最初の「世界マーケティング短信」は、年末から年始にかけての注目すべき動向をお届けする。