Emily Tan
2017年11月13日

アマゾンが音声認識技術に多額の投資をする理由

これまでのコンピューターは人間的でない不自然なやりとりが必要で、使う人を選ぶインターフェースだったと、アマゾンの最高技術責任者(CTO)ワーナー・ヴォーゲルズ氏は語る。

アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏
アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏

「これまで、全てのコンピューターは人間とでなく、コンピューターと対話するように設計されていました」と、ヴォーゲルズ氏は先週開催されていたウェブサミット(リスボン)でコメントした。

「そのため、人間的でない不自然なやりとりを強いられ、使う人を選ぶものでした」

同氏は、マニラの国際稲研究所(IRRI)の例を挙げる。「この研究所ではコメ生産に関するさまざまな研究を行い、生産量を伸ばすための取り組みを地元の農家と進めてきました。まず、重要な情報を網羅したウェブサイトを作成したのですが、農民がコンピューターを持っていなかったため、活用されませんでした。そこで、農民が自分の畑について音声で調べられるよう、音声技術を導入したところ、生産量が大きく伸びたのです」

また、スマートスピーカー「アマゾンエコー」の購入者がとても満足していることが、商品レビューからも見てとれると同氏は語る。「手軽に使えるため、日常のあらゆる雑務に活用しているようです」

ある認知症患者によると、アマゾンの音声アシスタント「アレクサ」を使うことで記憶が戻ったという。今日の日付を一日に20回聞いたとしても、怒ることなく正解を教えてくれるためだ。

ただしアマゾンの本命は、エコーのみではない。「エコー自体はまだそれほど賢くなく、クラウド上に構築された人工知能があってこそ」とヴォーゲルズ氏。「アレクサの音声サービスは、あらゆる処理をこなすプラットフォームによって支えられているのです」

ブランドや開発担当者は、アレクサスキル(アレクサに対応するプログラム)のキットでスキル開発をせずとも、リアルな音声合成サービス「アマゾンポリー」を活用することができる。

「ポリーはテキストを音声に変換するフルマネージドサービスで、47種類の声で、24の言語に対応しています。Duolingo(語学学習アプリ)にも、ポリーが使われています」

ポリーは声の種類、音量、文脈、発音などをコントロールすることができる。ヴォーゲルズ氏は実演して見せながら「ポリーを使えるのはアレクサだけでありません。音声によるチャットボット(対話ボット)を作成することもできるのです」と語った。

このような技術開発にアマゾンが投資するのは、人間的なインターフェースの導入がデジタルの未来を左右すると考えるためだ。

「音声認識技術をデジタルシステムに導入することで、システムの構築に大きな変革をもたらすと考えています」とヴォーゲルズ氏。「そして、デジタルネイティブではない全ての人にも、広く門戸を開くものと信じています」

(文:エミリー・タン 翻訳・編集:田崎亮子)

提供:
Campaign UK

関連する記事

併せて読みたい

Premium
カンヌライオンズ2019:日本勢の受賞作品
Premium
7 時間前

カンヌライオンズ2019:日本勢の受賞作品

今年のカンヌライオンズで注目を浴びた、日本勢の作品を紹介していく。

Premium
近藤麻理恵氏が広告界に語る:ミニマリズムと消費主義は共存可能か?
Premium
1 日前

近藤麻理恵氏が広告界に語る:ミニマリズムと消費主義は共存可能か?

片づけブームの第一人者である近藤麻理恵氏がカンヌライオンズで登壇する。これに先駆けCampaignは取材を実施した。

Premium
TikTok、「マーケティング新時代」を切り拓くか
Premium
4 日前

TikTok、「マーケティング新時代」を切り拓くか

動画共有アプリはオーディエンスを理解するだけでなく、共感を得ることが大切 −− 電通・前クリエイティブディレクターで今はTikTokを先導する鈴木瑛(あきら)氏がその戦略を語る。

Premium
世界マーケティング短信:PR業界の評価
Premium
4 日前

世界マーケティング短信:PR業界の評価

今週も世界のマーケティング界から、注目のニュースをお届けする。