Emily Tan
2017年11月13日

アマゾンが音声認識技術に多額の投資をする理由

これまでのコンピューターは人間的でない不自然なやりとりが必要で、使う人を選ぶインターフェースだったと、アマゾンの最高技術責任者(CTO)ワーナー・ヴォーゲルズ氏は語る。

アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏
アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏

「これまで、全てのコンピューターは人間とでなく、コンピューターと対話するように設計されていました」と、ヴォーゲルズ氏は先週開催されていたウェブサミット(リスボン)でコメントした。

「そのため、人間的でない不自然なやりとりを強いられ、使う人を選ぶものでした」

同氏は、マニラの国際稲研究所(IRRI)の例を挙げる。「この研究所ではコメ生産に関するさまざまな研究を行い、生産量を伸ばすための取り組みを地元の農家と進めてきました。まず、重要な情報を網羅したウェブサイトを作成したのですが、農民がコンピューターを持っていなかったため、活用されませんでした。そこで、農民が自分の畑について音声で調べられるよう、音声技術を導入したところ、生産量が大きく伸びたのです」

また、スマートスピーカー「アマゾンエコー」の購入者がとても満足していることが、商品レビューからも見てとれると同氏は語る。「手軽に使えるため、日常のあらゆる雑務に活用しているようです」

ある認知症患者によると、アマゾンの音声アシスタント「アレクサ」を使うことで記憶が戻ったという。今日の日付を一日に20回聞いたとしても、怒ることなく正解を教えてくれるためだ。

ただしアマゾンの本命は、エコーのみではない。「エコー自体はまだそれほど賢くなく、クラウド上に構築された人工知能があってこそ」とヴォーゲルズ氏。「アレクサの音声サービスは、あらゆる処理をこなすプラットフォームによって支えられているのです」

ブランドや開発担当者は、アレクサスキル(アレクサに対応するプログラム)のキットでスキル開発をせずとも、リアルな音声合成サービス「アマゾンポリー」を活用することができる。

「ポリーはテキストを音声に変換するフルマネージドサービスで、47種類の声で、24の言語に対応しています。Duolingo(語学学習アプリ)にも、ポリーが使われています」

ポリーは声の種類、音量、文脈、発音などをコントロールすることができる。ヴォーゲルズ氏は実演して見せながら「ポリーを使えるのはアレクサだけでありません。音声によるチャットボット(対話ボット)を作成することもできるのです」と語った。

このような技術開発にアマゾンが投資するのは、人間的なインターフェースの導入がデジタルの未来を左右すると考えるためだ。

「音声認識技術をデジタルシステムに導入することで、システムの構築に大きな変革をもたらすと考えています」とヴォーゲルズ氏。「そして、デジタルネイティブではない全ての人にも、広く門戸を開くものと信じています」

(文:エミリー・タン 翻訳・編集:田崎亮子)

提供:
Campaign UK

関連する記事

併せて読みたい

2 日前

40 Under 40 2025:APACの明日を担う、日本の若き才能

アジア太平洋地域(APAC)のマーケティング業界で活躍する若手の逸材を毎年選出する「40 Under 40」。今年、日本から選ばれた3人をご紹介する。

3 日前

ブラックストーン、米国外で初となる大規模マーケティングを日本で展開

世界最大のオルタナティブ投資会社ブラックストーンが、日本で大規模なマーケティングキャンペーンを展開。スティーブン・シュワルツマンCEOが長年築いてきた信頼を礎に、変革の時代におけるパートナーとして訴求する。

2025年9月11日

世界マーケティング短信:オグルヴィのグローバルCEOにエゼキエル氏

今週も世界のマーケティング界から、注目のニュースをお届けする。

2025年9月10日

変化に備えよ 広告業界は今後2年間で激変する

WPPのCEO交代と、電通グループの海外事業の売却可能性。これらは、世界的に広告業界に大きな変化が訪れようとしていることを示す、ほんの2つの兆候に過ぎない。