微軟執行長 Satya Nadella 在前日的 AIPC 發表會上,曾說一句話:
30 年前,我在同樣的地方發表 Windows 95。現在,為了新一代的人工智慧個人電腦 AIPC,我還是站在這裡。
在這個時間點上談論 Windows 95,Nadella 意識到了什麼?這是我第一個念頭。
眾所皆知 Windows 95 是引爆個人電腦成長的第一個產品,當時人們排隊購買 CD-ROM 盒裝 Windows,熱潮一直不退。Windows 95 帶給當時最大的使用者體驗是全視窗應用,對應於上一代 Windows 3.1 雖然已是視窗介面,但許多應用仍然需要 MS-DOS 指令集,尤其是安裝軟體時需要背一些英文指令,很多人應該還記得必須放在電腦旁邊隨時參照引用。
除了全視窗應用之外,就是 Windows 95 內建的瀏覽器 Explorer,這也是人首次知道上網的工具,主打的賣點是「任何人」都可以使用電腦,「不會打字的家庭主婦也能使用」成為廣告標題。
30年歷史
過去 30年,人類經歷過許多資訊革命,但是許多經典仍然不會改變,GUI 就是一個。iPhone 承襲視窗與GUI,甚至 Vision Pro 的空間運算都不能避免。此時的微軟似乎像是昨日黃花,Windows 變成人人害怕的作業系統。直到今日,微軟發布的 AIPC 就好像是沙丘電影裡拯救帝國的保羅亞崔迪,走向資訊革命終局之戰。
Nadella 宣稱 AIPC 能夠支持多種模態(multi-modal),包過文本、圖像、影片與語音,保留重要的上下文脈理解,並在所有應用裡記住個人知識與數據。顯然表現出個人運算平台開始需要新一代的使用者經驗與介面,以支持自然互動的場景,基於目前我們已知的 Copilot 而言,目前做得最好是 OpenAI CPT-4o,但相信很快微軟也會為了Copilot 進行更新。
Copilot 成為鍵盤上的快速鍵,對比起 Windows 95 的地球圖像是有這麼一點異曲同工之妙,但是對於設計師來說,這成為一個全新挑戰:如何在多模態環境中,讓使用者可以順利銜接到人工智能環境,使用者新製模型顯得越來越不重要,系統可以接受使用者打斷對話、不存檔、塗鴉甚至一切不完整資訊。使用者經驗顯然也需要重新設計,這讓我思考未來使用者經驗應該需要如何對應。
陪伴型使用者經驗
我們設計師過去對於圖像使用者介面有個假設,就是他必須要符合一些基礎使用者意向,以免使用者困惑。例如「確認」跟「取消」在某些場合不能擺在一起,以免使用者會感到困惑而妨礙使用經驗。雖然是對的,但是背後的成因是設計目的必須要「引導」使用者完成某些動作,以免系統產生錯誤碼,或是系統限制無法做出對應。
引導型使用者經驗著重資訊架構、分析、情境與語境,即使到虛擬實境仍然可以看到視窗與圖式,就是承襲引導型使用經驗。不過,在多模態環境中,引導型使用體驗顯得力不從心,人工智慧不需要確認與取消,或者是說,當我們跟人工智慧互動時,感覺不像是「操作」,而是「陪伴」。
陪伴型使用體驗能夠讓使用者任意使用鍵盤、觸碰螢幕、手勢或是語音進行一到多種互動,目的不妨礙使用者心流,新發表的 Recall 功能就是一個例子。簡單來說,Recall 會能夠詢問「我前幾天在哪裡做了那件事?」,讓使用者找到相關 Teams 訊息或文件。當 Recall 螢幕截圖時,NPU 將會了解影像內容,並創建內容索引,為使用者建立歷史紀錄,而不妨礙工作。另外一個例子在 CoCreator 功能,使用者生成完照片後,連結到 Xbox 平台可以提出諸如「下一步該怎麽走」等問題,就可以成為玩家圖像等。
無形介面
Copilot 現在顯示的只是一個切入點,如果更深入思考的話,也許有些人會發現 GUI 好像無用武之地,操作面都由人工智能代勞了。但並不是說介面不再重要,也許可以說介面將會進入「無形介面」狀態。在對話角度看來,如果訊息都能用 API 應用界面對接,當我們在 Copilot 上叫一台 Uber 時,使用者會用麥克風對話,系統會出現一張地圖跟車子與你的距離,直接秀出價錢並且你只需要回答:沒問題。這樣子的協同關係影響的不僅僅是系統層面,個人資料提取、影像、文字與語音合成到生成互動都是各種應用層必須要解決的場景。
更重要的是,你連一顆按鈕都不需要按,就完成操作了。
這並不是天方夜譚,生成式人工智能之所以能夠產生巨大影響力,絕非只有提高人類生產力這麼簡單,而是它根本改變人類與個人電腦運算平台的相處模式,人們不是被迫學習新方法,而是這方法無所不在。這一切就像是過去 Windows 95、iPhone 時刻重新來過一遍,只不過生態系即將展開更大競爭。
其中一個競爭發生在軟體工程上,微軟發表 AIPC 的大會也同時發表一個合作關係,與新創公司 Cognition AI 合作新的人工智能軟體設計 Devin。Devin 是一個由人工智能驅動的軟體設計師,具有實現自主系統開發的能力。具體來說,當人類給它下達任務時,Devin 會根據任務制定開發計劃,根據參考 GitHub 中的 readme 等自動構建環境,參考文件中的 API 規範,在此基礎上編寫程式,並印出語法進行調試。在調試時,據說系統能夠使用語法等確定錯誤位置,解決問題,並在系統運行後進行部署。
接下來不需要人就可以工作時,可能大家要想的是,使用者經驗設計要做什麼?恩。。。