Năm 2018, Amazon đã mời tôi về làm Trưởng nhóm Thiết kế Âm thanh UX cho Astro, robot gia đình tiêu dùng đầu tiên của họ. Astro sử dụng camera và các cảm biến khác để lập bản đồ, điều hướng ngôi nhà và nơi làm việc của bạn, có thể tự động tuần tra, kiểm tra người thân và vận chuyển các vật dụng nhỏ bằng ngăn chứa tích hợp sẵn.
Ban đầu, với một bộ tính năng và hình dáng được định rõ, nhưng không có định hướng về tính cách. Thậm chí trước khi Astro có tên, có hai câu hỏi lớn: nó chỉ đơn thuần là Alexa trên bánh xe, hay là một robot với tính cách riêng biệt? 🤔
Cuộc chiến định hình 'linh hồn' của Astro
Nhóm phát triển Astro bị chia rẽ. Một phe muốn tập trung vào Alexa, coi robot di động chỉ là một tiện ích bổ sung. Tuy nhiên, tôi cùng đa số nhóm UX đã lập luận rằng một vật thể di chuyển trong nhà và hướng về phía bạn với chủ ý không bao giờ có thể chỉ là một thiết bị. Mọi người sẽ tự gán cho nó một tính cách, dù chúng ta muốn hay không. Vì vậy, câu hỏi duy nhất là liệu chúng ta có định hình tính cách đó hay để nó tự phát triển một cách ngẫu nhiên.
Cuối cùng, Astro đã trở thành Astro chứ không phải Alexa. Các thử nghiệm người dùng đã chứng minh quyết định này là đúng đắn. Người dùng không coi robot là Alexa; họ coi nó là một nhân vật riêng biệt và đó chính là điều họ mong muốn. Việc Alexa nói chuyện qua Astro có vẻ hơi kỳ lạ và đáng sợ, nhưng việc xây dựng một giọng nói riêng cho Astro lại quá tốn thời gian và chi phí vào năm 2018. Vì vậy, chúng tôi quyết định để Alexa đóng vai trò hỗ trợ, xử lý mọi cuộc hội thoại, trong khi Astro là nhân vật chính, giao tiếp bằng âm thanh, chuyển động và biểu cảm khuôn mặt mà không cần lời nói.
Là Trưởng nhóm Âm thanh, tôi đã đảm nhận vai trò định hình tính cách của robot. Bởi vì, bạn không thể đưa ra một quyết định thực sự về nhân vật nếu chưa định nghĩa nó trước. Mọi lựa chọn về cách Astro di chuyển, phát ra âm thanh, tạm dừng hay phản ứng đều là lựa chọn về tính cách, và những lựa chọn đó đòi hỏi sự phối hợp của tất cả các bộ phận. Công việc thực sự của tôi đã bắt đầu từ đó, và những gì tôi học được về việc xây dựng tính cách cho robot có thể áp dụng cho hầu hết mọi sản phẩm AI vật lý đang được phát triển hiện nay. 💡
Tính cách là một hệ thống thiết kế
Phát triển tính cách cho Astro có nghĩa là phải trả lời những câu hỏi chưa từng được đặt ra cho một sản phẩm tại Amazon: Phạm vi cảm xúc cơ bản của robot này là gì? Làm thế nào để robot này truyền đạt sự không chắc chắn mà không làm xói mòn lòng tin? Đâu là ranh giới giữa việc biểu cảm và gây phiền nhiễu? Những điểm yếu trong tính cách của thiết bị này là gì?
Đây là những câu hỏi thiết kế cần có câu trả lời rõ ràng, và mọi nhóm làm việc trên sản phẩm đều phải xây dựng dựa trên chúng. Ví dụ, phạm vi cảm xúc của Astro ban đầu được thiết kế khá nhỏ. Chúng tôi không bao giờ muốn Astro quá buồn hay quá tức giận. Nó có thể thể hiện sự buồn bã, nhưng sẽ nhanh chóng thoát ra khỏi trạng thái đó và kết thúc phản ứng một cách tích cực để duy trì sự vui vẻ. 😊
Tính cách toát ra từ mọi khía cạnh và có thể tạo ra trải nghiệm rời rạc nếu không được định nghĩa đúng. Ngay cả khi chỉ là thời gian hoạt ảnh hơi lệch hoặc một phản ứng đúng kỹ thuật nhưng lạc lõng về mặt ngữ cảnh, người dùng sẽ cảm nhận được mọi sự không nhất quán này, dù họ không thể gọi tên. Điều này gọi là "character stitching" – sự liền mạch giữa các khoảnh khắc biểu cảm, giúp màn trình diễn trở nên liên tục thay vì chắp vá.
Câu chuyện và âm thanh phải có từ đầu
Chúng tôi quyết định Astro sẽ không có lời thoại, nhưng nó có một thứ hoạt động tương tự: một vốn từ vựng gồm âm thanh, tông điệu và nhịp điệu đóng vai trò là giọng nói của nó. Vốn từ vựng này trở thành yếu tố hàng đầu thể hiện cá tính của nhân vật. Chuyển động và biểu cảm khuôn mặt của robot đều được xây dựng xung quanh nó. 🎶
Ví dụ điển hình là trình tự thức dậy của Astro. Thức dậy không chỉ là một hoạt ảnh khởi động trên màn hình; đó là cả một màn trình diễn. Đầu tiên, robot di chuyển chậm rãi và khiêm tốn, sau đó vươn màn hình, kiểm tra bánh xe, và cuối cùng, với cử chỉ vươn cao cột telescoping, nó nhô lên một chút và nhảy một điệu nhảy vui vẻ. Âm thanh, chuyển động và ánh mắt hòa quyện nhịp nhàng trong một màn vũ đạo hoàn chỉnh. 💃
Kết quả của nhân vật trong trình tự đó ban đầu được viết như một câu chuyện: Astro lần đầu tiên thức dậy trong ngôi nhà mới của mình. Khát vọng chính của nó là trở thành một phần của gia đình, vì vậy đây là khoảnh khắc nó đã chờ đợi, đây là mục đích của nó. Là một nhân vật có trách nhiệm, nó muốn đảm bảo mọi thứ đều ổn trước khi tự giới thiệu và bắt đầu tìm hiểu ngôi nhà mới của mình.
Câu chuyện này được đặt lên hàng đầu vì nó định hướng mọi quyết định khác. Sau khi câu chuyện được viết, âm thanh đã mang đến một giọng nói ẩn dụ cho câu chuyện đó: những tông điệu phấn khích, nhịp điệu khi nó kiểm tra bánh xe, và giai điệu tươi sáng khi Astro lần đầu tiên nhìn lên gia đình mới của mình và tự giới thiệu. Một khi âm thanh được định hình, hoạt ảnh sẽ thực hiện công việc của mình với chuyển động và biểu cảm khuôn mặt, lấy gợi ý từ cung bậc cảm xúc mà âm thanh đã thiết lập. Chuyển động không dẫn đầu – nó tuân theo cảm xúc của câu chuyện và âm thanh, giống như cách một nhà làm phim hoạt hình theo dõi một bản ghi âm giọng nói. 🎬
Trình tự thức dậy đó đã trở thành một trong những khoảnh khắc được thảo luận nhiều nhất trong các thử nghiệm người dùng ban đầu. Mọi người mô tả nó là "sống động". Điều họ phản ứng không phải là một yếu tố đơn lẻ, mà là cả ba kênh (âm thanh, chuyển động và biểu cảm khuôn mặt) cùng thể hiện một tính cách đã được định nghĩa một cách hài hòa.
Ngữ cảnh là nơi tính cách trở nên thật
Những nhân vật hấp dẫn nhất không được định nghĩa bởi một tính cách cố định mà bởi cách họ phản ứng với môi trường và những người xung quanh. Họ vẫn là chính mình ngay cả khi họ thích nghi. Đây là điều tôi gọi là tính cách theo ngữ cảnh. Một robot sống trong nhà không duy trì một trạng thái cảm xúc duy nhất. Nó di chuyển qua các phòng với năng lượng khác nhau, gặp gỡ những người có tâm trạng khác nhau, hoạt động vào những thời điểm khác nhau trong ngày và phản ứng với vô số tình huống xã hội mà nó không bao giờ được thiết kế rõ ràng cho.
Chúng tôi đã tiến gần đến việc tạo ra tính cách theo ngữ cảnh cho âm thanh của Astro. Khi một phần ngữ cảnh môi trường cụ thể được đưa vào, hệ thống thích ứng đẹp mắt và Astro cảm thấy hoàn toàn sống động. Tuy nhiên, mỗi trạng thái như vậy vẫn là một dự đoán chúng tôi thực hiện thủ công – một tình huống chúng tôi phải tưởng tượng trước và thiết kế phản ứng cho. Một ngôi nhà ngẫu nhiên đặt ra nhiều tình huống cho một robot hơn bất kỳ ai có thể dự đoán, vì vậy luôn có một chuỗi dài các khoảnh khắc mà hệ thống không bao giờ được chuẩn bị.
Sự khác biệt giữa một sản phẩm được mô tả là "thông minh" và một sản phẩm được mô tả là "nhận thức" thường nằm ở điểm này. Thông minh là khả năng. Nhận thức là ngữ cảnh. Hiện diện là tính cách. Và tính cách luôn là sự phản ứng với những người xung quanh, với môi trường của nó, với trạng thái phát triển của chính nó. Đó là điều khiến bạn cảm thấy có một thứ gì đó đang hiện diện về mặt cảm xúc với bạn. 💖
Đây là nơi AI thay đổi cuộc chơi cho thiết kế tính cách theo những cách vượt xa những gì có thể làm được với Astro. Khả năng thích ứng dựa trên AI không yêu cầu các dự đoán ngữ cảnh mà chúng tôi đã dựa vào. Nó học các nhịp điệu, sở thích và ngữ cảnh cảm xúc cụ thể của những người mà nó sống và làm việc cùng. Tính cách không chỉ phản ứng với ngữ cảnh, mà còn phát triển cùng nó.
Ngành công nghiệp đang bỏ lỡ điều gì? 🤔
Tính cách và "linh hồn" của làn sóng sản phẩm AI vật lý sắp tới dường như luôn là một điều gì đó bị bỏ quên. Và tính cách được định nghĩa muộn chính là tính cách được định nghĩa mặc định. Nó trở thành tổng hòa của hàng ngàn quyết định nhỏ được đưa ra bởi những người khác nhau, nghĩ về mọi thứ trừ tính cách. Mọi người tự gán tính cách cho các thiết bị dù bạn có lên kế hoạch hay không, đặc biệt nếu các thiết bị đó di chuyển – một robot di chuyển đã là một nhân vật rồi. Nếu không ai thiết kế nhân vật này, kết quả sẽ là những sản phẩm cảm thấy vô vị, hoặc tệ hơn, gây khó hiểu và không đáng tin cậy. Ấn tượng về mặt kỹ thuật, nhưng vô hồn.
Chúng tôi đã không hoàn toàn làm đúng điều này với Astro. Có quá nhiều thứ diễn ra song song khiến tính cách hiếm khi được coi là một tiện ích, và điều đó có lý do. Khi bạn đang xây dựng một sản phẩm độc nhất vô nhị, những thứ ồn ào nhất là những gì hỏng hóc, thời hạn, chi phí, các tính năng mà khách hàng có thể chỉ vào trên hộp sản phẩm. Tính cách thì thầm hơn tất cả những điều đó. Dễ dàng cho rằng nó có thể đến sau. Trong một nhóm lớn như nhóm Amazon Astro, thật may mắn nếu có bất kỳ ý tưởng nào được đưa vào lộ trình khi nó phải cạnh tranh với hàng trăm ý tưởng khác đều cảm thấy cấp bách hơn vào thời điểm đó. Điều này không phải vì mọi người không quan tâm, mà vì tính cách là thứ khó ưu tiên cho đến khi bạn thấy cái giá phải trả khi thiếu nó. 💔
Lời nhắn gửi của tôi tới các nhà lãnh đạo sản phẩm
Nếu bạn đang xây dựng một sản phẩm sẽ chia sẻ không gian vật lý hoặc hội thoại với con người, ba điều sau đây đáng để cân nhắc:
* Định nghĩa tính cách trước khi định nghĩa tương tác. Bạn cần một tính cách đáng tin cậy với đủ logic cảm xúc để trả lời nhất quán các câu hỏi khó. Tìm câu trả lời cho các câu hỏi về tính cách sớm, và yêu cầu mọi bộ phận xây dựng từ cùng một nền tảng. * Xây dựng câu chuyện và âm thanh vào quy trình phát triển tính cách, không phải quy trình sản xuất. Câu chuyện và âm thanh được phát triển cùng với định nghĩa tính cách có cơ hội định hình chuyển động, biểu cảm và logic tương tác. Điều này đòi hỏi một loại hình hợp tác khác và một loại nhân sự khác. * Thiết kế cho khả năng thích ứng, không chỉ nhất quán. Một tính cách nhất quán là cần thiết, nhưng những sản phẩm có ý nghĩa nhất trong cuộc sống của mọi người là những sản phẩm trở nên sâu sắc hơn qua quá trình sử dụng. Cơ sở hạ tầng để hỗ trợ điều đó ngày càng dễ tiếp cận, nhưng tư duy thiết kế để tận dụng nó vẫn còn hiếm. 🚀