視覺智能(Visual Intelligence)是結合一些文字與圖像的反向搜尋,舉例來說,如果你用 iPhone 裡內建的視覺智慧搜尋一家餐廳,會顯示餐廳的營業時間、評分,以及查看菜單或預約的選項。或者,如果你看到一個活動的傳單,你可以使用視覺智能快速地添加標題,時間,日期和地點到您的日曆。
視覺智能的搜尋資訊來自 Google Search,更有一些評論顯示出,這跟兩年前發表的 Google Lens 沒有什麼兩樣。雖說這不能算是一個超越前者的創新,但我認為仍然有 2 種意義:視覺智能終將成為行動運算,以及個人最佳化助理的最終形態。
第一點比較容易理解,我們都知道行動運算最終是希望以眼鏡加上手錶,以取代手機停滯的銷量與創新。不過,現今基於視覺辨識的運算方案都沒有好到足以放棄手機,更不要說眼鏡跟手錶都有電力問題。輕量化後的視覺智能加上手勢辨識,讓我們看到一絲絲希望,而最接近的方案就是(亂取名的) Vision Air 加上 Apple Watch。
第二是個人最佳化助理。助理的互動模式不只有對話,更實際的是基於視覺基礎的助理能力,像是影片裡的傳單。事實上我還可以想到更多,例如辨識發票、藥品、名片等一些應用場景,都能有效的進行資料處理。另外想想,也有可能因為地端人工智能太強大,可能有些依賴視覺辨識的 APP 應用會從此失去競爭力,成為手機標配。
最後,今年被稱為史上最無趣的蘋果發表會後(不確定以後會不會更無趣),視覺智能將會大大影響互動設計的層面會超越其他多模態(multi-modal)行為。接下來就是期待手部辨識,能像iPhone 多重觸控(multi-touch)一樣,成為行動運算的標準,成為最後一張拼圖。