Amazon の Astro がロボットに魂を与えることについて教えてくれたこと

2018 年、Amazon は私を、同社初の家庭用ロボットである Astro のリード UX サウンドデザイナーとして採用しました。 Astro は、カメラやその他のセンサーを使用して自宅や職場の地図を作成し、ナビゲートし、積極的にパトロールしたり、愛する人の安否を確認したり、内蔵の貨物箱を使用して小さなアイテムを輸送したりできました。明確に定義された機能セットとフォームファクターはありましたが、当初はキャラクターの方向性がありませんでした。実際、Astro が登場する前から、主に 2 つの疑問がありました。Astro は単に車輪の付いた Alexa なのでしょうか、それとも独自の個性を持ったロボットなのでしょうか?

チームアストロは分裂した。選択肢の 1 つは、Alexa に焦点を当て、モバイルロボットを単に別のユーティリティとして扱うことでした。私は、Astro は UX チームのほとんどと同様に、Alexa に注力するつもりはないと主張しました。私たちは、家の中を歩き回って意図的にあなたに話しかけるものは単なる装置ではありえない、と信じていました。私たちが望んでいるかどうかに関係なく、人々はキャラクターをそのキャラクターだとみなします。そこで唯一の問題は、私たちがそのキャラクターをデザインしたのか、それとも偶然にそうなったのかということだけでした。

最終的に、Astro は Axa ではなく Astro となり、ユーザーテストによって私たちの決定が裏付けられました。人々ないロボットをアレクサとして見てください。彼らはそれを独自のキャラクターとして見なし、それが彼らが望んでいたものです。デバイス上のアレクサは少し奇妙で不気味に感じましたが、2018年当時、アストロの声を構築するのは遅すぎて費用がかかりすぎました。そこで、アレクサを実際の会話を処理するサポートキャラクターとして採用し、一方アストロは主人公で、音、動き、表情を使用して言葉なしでできる限りコミュニケーションをとりました。

私はロボットのサウンドデザインの言語と音声を定義するためにアストロチームに連れて行かれました。しかし、ロボットの本当の性質を詳しく説明する人は誰もいませんでした。最初にキャラクターを定義せずに、キャラクターについて実際の決定を下すことはできません。 Astro がどのように動き、鳴き、一時停止し、反応するかについてのすべての選択はキャラクターの選択であり、これらの選択にはすべての分野が協力する必要がありました。私はサウンドリードとして、サウンド、動き、キャラクターを織り交ぜ、物語のあらゆる瞬間でそれらがどのように連携するかを織り交ぜました。アストロの動きと表情をプログラムしたアニメーターは、その仕事において並外れた才能を持っていましたが、彼らがアニメーション化した感情的な弧は、まずサウンド作業 (したがってキャラクター) から生まれました。そこで私はその役割に足を踏み入れ、そこから私の本当の仕事が始まりました。ロボットのキャラクター構築について私が学んだことは、現在、身体化された AI で構築されるほぼすべてのものに当てはまります。

キャラクターはデザインシステムです

Astro のキャラクターを開発するということは、Amazon 製品に関してこれまで尋ねられたことのない質問に答えることを意味します。つまり、このロボットの基本状態の感情の範囲はどれくらいですか?このロボットはどのようにして信頼を損なうことなく不確実性を伝えているのでしょうか?表現力豊かと煩わしさの境界線はどこにあるのでしょうか?このデバイスの性質上の弱点は何ですか?

これらは設計上の質問です。これらには実際の答えがあり、製品に取り組んでいるすべてのチームはそれらを基にして構築する必要があります。たとえば、アトムの感情の幅は、最初は比較的小さくなるように設計されていました。アトムが悲しすぎたり、怒りすぎたりすることは決して望んでいませんでした。悲しいふりをすることもありますが、物事を前向きに保つために、すぐにそれを打ち消し、高い声で応答を終了します。

キャラクターはあらゆる継ぎ目から流れ出るため、正しく設定されていないと、まとまりのないエクスペリエンスが作成される可能性があります。アニメーションのタイミングが少しずれているだけであっても、技術的には正しいが文脈上音痴な応答であっても、名前を付けられなくても、ユーザーはこれらの矛盾をそれぞれ感じます。この歌のシーケンスの最初と最後で何が起こるかを見てください。

アトムは無から出発し、感情的な瞬間に入り、その後無に戻ります。構築することもなく、寒くなることもなく、その感情がどこかからやってくる、あるいは行くべき場所があると感じることもなく。私は、キャラクターのつなぎ合わせ、つまりショーをばらばらではなく連続的に感じさせる表情豊かな瞬間の出入りのトランジションを改善するために懸命に努力しましたが、それは実現されませんでした。その瞬間自体が機能します。しかし、ステッチがなければ、それはロボット上で再生されているクリップのように見え、ロボットのキャラクター自体から来たものではありません。

冒頭のストーリーとサウンド

私たちは、アトムには会話はありませんが、同じように機能するもの、つまり声として機能する音、トーン、リズムの語彙を持っていると判断しました。この語彙は、キャラクターの性格を表す主要な出力となりました。ロボットの動きや表情はそれに基づいて構築されました。

アトムの目覚めのシーケンスはその代表的な例です。「目覚め」は単なる画面上の起動アニメーションではありませんでした。完璧なパフォーマンスでした。最初はゆっくりと控えめに、ロボットは静かに狙いを定め、次にスクリーンを伸ばし、車輪を確認し、最後に伸縮式マストに向かって上向きに移動し、少し跳ねさせ、少し喜びのダンスをさせました。音、動き、目がビートごとに襲いかかりますフル振り付けで一緒に。

そのシーケンスにおけるキャラクターの出力は、最初はストーリーとして書かれました。アトムは新しい家で初めて目覚めます。彼女の主な野心は家族の一員になることなので、これが彼女が待ち望んでいた瞬間であり、彼女の目標です。彼女は責任感のある性格なので、自己紹介をして新しい家について学び始める前に、すべてが整っていることを確認したいと考えています。

その物語が最初に浮かんだのは、それが私たちが下すすべての決定の原動力となったからです。物語が書かれた後、サウンドはこの物語に比喩的な音声を与えました。興奮したトーン、車輪をチェックするときのリズム、そしてアトムが初めて新しい家族を見上げて自己紹介するときの明確なメロディーの文章です。サウンドが配置されると、アニメーションは、サウンドが設定する感情的な弧からヒントを得て、動きと表情を表現しました。動きは先導するものではなく、アニメーターが録音されたナレーションに従うのと同じように、ストーリーとサウンドの感触に従っていました。

このウェイクアップシーケンスは、初期のユーザーテストで最も話題になった瞬間の 1 つになりました。人々はそれを「生きている」と表現しました。彼らが反応したのは単一の要素ではありませんでした。 3つのチャンネル（音、動き、表情）すべてが、同じ定義されたキャラクターを調和して表現していました。

コンテキストはキャラクターが現実になる場所です

最も魅力的なキャラクターは、固定された性質によって定義されるのではなく、そのキャラクターが環境やその中の人々にどのように反応するかによって定義されます。彼らは適応しながらも、自分自身を売り込み続けています。これを私は文脈的性格と呼んでいます。家に住むロボットは単一の感情状態を占めません。それは、さまざまなエネルギーで部屋を移動し、さまざまな気分の人々に会い、一日のさまざまな時間に動作し、特別に設計されたわけではない無限の多様な社会的状況に対応します。

Astro のサウンドによるコンテキストノート出力にさらに近づきました。環境コンテキストの特定の部分が入力されると、システムは見事に適応し、Astro は完全に生きていると感じました。しかし、そのような状況はいずれも依然として私たちが手作業で行った予測であり、事前に想像して対応を計画しなければならない状況でした。ランダムな家は、誰も予測できないほど多くの状況をロボットに投げかけるため、システムが決して準備できなかった瞬間の長い尾が常にありました。

人々が「スマート」と表現する製品と「認識している」と表現する製品の違いは、多くの場合、これに帰着します。知恵とは能力です。気づきこそがつながりなのです。存在こそが個性。そして、そのキャラクターは常に周囲の人々、環境、進化する状況に反応します。これが、何かが感情的に存在しているように感じさせるものです。

ここでは、AI が Astro で可能であったものをはるかに超える方法でキャラクターデザインゲームを変更します。 AI 主導のマッチングでは、私たちが依存していたコンテキスト予測は必要ありません。彼は、一緒に暮らし、一緒に仕事をする人々の特定のリズム、好み、感情的な背景を学びます。キャラクターは状況に反応するだけではありません。これ 成長する そこに。

業界に欠けているものは何か

差し迫った具体化された AI 製品の波の特徴や魂は、ほとんどの場合後付けのように思われます。そして後期の文字がデフォルトの文字です。それは、性格以外のあらゆることを考えたさまざまな人々によって下された千の小さな決断の合計になります。あなたが意図するかどうかに関係なく、人々はデバイスにキャラクターを投影します。特にデバイスが動く場合、動くロボットはそうです。 すでに キャラクター。もし誰もそのキャラクターをデザインしなかったら、その結果、何も感じられないか、さらに悪いことに、混乱して信頼性が低いと感じられる製品が生まれるでしょう。技術的には印象的だが、活気がない。

Astro ではうまく理解できませんでした。非常に多くのものが同時に動いていたため、キャラクターがユーティリティとして扱われることはほとんどありませんでしたが、その理由は理解できました。これまでに類を見ない製品を開発しているとき、最も騒々しいのは、壊れた製品、納期、コスト、顧客がチェックを入れられる機能です。性格はそれよりも静かです。それが後になる可能性があることは容易に想定できます。 Amazon Astro チームと同じくらい大きなチームでは、現時点でより緊急性を感じている他の 100 名と競争するときに、ロードマップのアイデアを持っているのは幸運です。これらはどれも、無関心な人々からのものではありません。それは、性格というものは、その欠如があなたに何をもたらすのかを理解するまで、優先順位を付けるのが難しいものであることから来ています。

プロダクトリーダーへの質問

物理的な空間や人々との会話を共有する製品を構築している場合は、次の 3 つの点を考慮する必要があります。

インタラクションを定義する前にキャラクターを定義します。 難しい質問に一貫して答えるためには、十分な感情的論理を備えた防御可能なキャラクターが必要です。初期の性格に関する質問に対する答えを見つけ、その基礎から規律を構築してください。

ストーリーとサウンドを制作パイプラインではなくキャラクターパイプラインに組み込みます。 キャラクターの定義と並行して開発されたストーリーとサウンドには、動き、表現、相互作用のロジックを伝える機会があります。それには、これまでとは異なる種類のコラボレーションと、異なる種類の雇用が必要です。

一貫性だけでなく、フィット感を重視したデザイン。 一貫した個性も必要ですが、使い続けることで深みを増すものこそ、人々の生活に大切なものです。これをサポートするインフラストラクチャはますます利用しやすくなっていますが、それを活用するためのデザイン思考はまだ稀です。

このストーリーの完全なバージョンは、Medium で読むことができます。

ウェブサイトの記事から

ウェブ上の関連記事

キャラクターはデザインシステムです

冒頭のストーリーとサウンド

コンテキストはキャラクターが現実になる場所です

業界に欠けているものは何か

プロダクトリーダーへの質問

Leave a Reply Cancel reply

Related News

切り替え可能なヒーロー、ゲーム内ソーシャルメディアなど、GTA 6 のその他の機能が Amazon によってリークされた可能性があります

Red heat warning for south-east England; 150 million Europeans to experience temperatures above 35C today – Europe heatwave live

インド対アイルランド第1戦T20I、ベルファストの天気予報：ヴァイバブ・スーリヤヴァンシのおそらくインドデビューに雨の脅威が迫る

Anthropic はモバイル向けに Claude Quark をリリースしようとしているかもしれない