Emily Tan
2017年11月13日

アマゾンが音声認識技術に多額の投資をする理由

これまでのコンピューターは人間的でない不自然なやりとりが必要で、使う人を選ぶインターフェースだったと、アマゾンの最高技術責任者(CTO)ワーナー・ヴォーゲルズ氏は語る。

アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏
アマゾンの最高技術責任者(CTO)、ワーナー・ヴォーゲルズ氏

「これまで、全てのコンピューターは人間とでなく、コンピューターと対話するように設計されていました」と、ヴォーゲルズ氏は先週開催されていたウェブサミット(リスボン)でコメントした。

「そのため、人間的でない不自然なやりとりを強いられ、使う人を選ぶものでした」

同氏は、マニラの国際稲研究所(IRRI)の例を挙げる。「この研究所ではコメ生産に関するさまざまな研究を行い、生産量を伸ばすための取り組みを地元の農家と進めてきました。まず、重要な情報を網羅したウェブサイトを作成したのですが、農民がコンピューターを持っていなかったため、活用されませんでした。そこで、農民が自分の畑について音声で調べられるよう、音声技術を導入したところ、生産量が大きく伸びたのです」

また、スマートスピーカー「アマゾンエコー」の購入者がとても満足していることが、商品レビューからも見てとれると同氏は語る。「手軽に使えるため、日常のあらゆる雑務に活用しているようです」

ある認知症患者によると、アマゾンの音声アシスタント「アレクサ」を使うことで記憶が戻ったという。今日の日付を一日に20回聞いたとしても、怒ることなく正解を教えてくれるためだ。

ただしアマゾンの本命は、エコーのみではない。「エコー自体はまだそれほど賢くなく、クラウド上に構築された人工知能があってこそ」とヴォーゲルズ氏。「アレクサの音声サービスは、あらゆる処理をこなすプラットフォームによって支えられているのです」

ブランドや開発担当者は、アレクサスキル(アレクサに対応するプログラム)のキットでスキル開発をせずとも、リアルな音声合成サービス「アマゾンポリー」を活用することができる。

「ポリーはテキストを音声に変換するフルマネージドサービスで、47種類の声で、24の言語に対応しています。Duolingo(語学学習アプリ)にも、ポリーが使われています」

ポリーは声の種類、音量、文脈、発音などをコントロールすることができる。ヴォーゲルズ氏は実演して見せながら「ポリーを使えるのはアレクサだけでありません。音声によるチャットボット(対話ボット)を作成することもできるのです」と語った。

このような技術開発にアマゾンが投資するのは、人間的なインターフェースの導入がデジタルの未来を左右すると考えるためだ。

「音声認識技術をデジタルシステムに導入することで、システムの構築に大きな変革をもたらすと考えています」とヴォーゲルズ氏。「そして、デジタルネイティブではない全ての人にも、広く門戸を開くものと信じています」

(文:エミリー・タン 翻訳・編集:田崎亮子)

提供:
Campaign UK

関連する記事

併せて読みたい

1 日前

巨大IT企業、AIコストを増大

アルファベット、アマゾン、メタ、マイクロソフト……大手IT企業が相次いで設備投資を増やしている。注力するのは、AIの性能を高めるコンピューティングリソースだ。

1 日前

ソーシャルメディアでユーモアを発揮するには、文化盗用に用心を

オーディエンスとのつながりを求めるブランドは、真正性さに欠ける言葉を使わないように――。アレン&ゲリッツェン(Allen & Gerritsen)のPRアソシエイト、タイラー・ブリンダムール氏はこのように説く。

1 日前

なぜ一部のブランドは、生成AIの活用に慎重なのか?

昨年のAIブームの熱狂と興奮が収まりつつある今、一部のブランドやエージェンシーがリスクを回避するためAI導入に懐疑的な姿勢をとっている。その理由をCampaignが探った。

2024年5月02日

クリエイティブマインド : メリッサ・ボゥイ(MRMジャパン)

気鋭のクリエイターの実像に迫るシリーズ、「クリエイティブマインド」。今回ご紹介するのはMRMジャパンのシニアアートディレクター、メリッサ・ボゥイ氏だ。