視覺智能

視覺智能（Visual Intelligence）是結合一些文字與圖像的反向搜尋，舉例來說，如果你用 iPhone 裡內建的視覺智慧搜尋一家餐廳，會顯示餐廳的營業時間、評分，以及查看菜單或預約的選項。或者，如果你看到一個活動的傳單，你可以使用視覺智能快速地添加標題，時間，日期和地點到您的日曆。

視覺智能的搜尋資訊來自 Google Search，更有一些評論顯示出，這跟兩年前發表的 Google Lens 沒有什麼兩樣。雖說這不能算是一個超越前者的創新，但我認為仍然有 2 種意義：視覺智能終將成為行動運算，以及個人最佳化助理的最終形態。

第一點比較容易理解，我們都知道行動運算最終是希望以眼鏡加上手錶，以取代手機停滯的銷量與創新。不過，現今基於視覺辨識的運算方案都沒有好到足以放棄手機，更不要說眼鏡跟手錶都有電力問題。輕量化後的視覺智能加上手勢辨識，讓我們看到一絲絲希望，而最接近的方案就是（亂取名的) Vision Air 加上 Apple Watch。

第二是個人最佳化助理。助理的互動模式不只有對話，更實際的是基於視覺基礎的助理能力，像是影片裡的傳單。事實上我還可以想到更多，例如辨識發票、藥品、名片等一些應用場景，都能有效的進行資料處理。另外想想，也有可能因為地端人工智能太強大，可能有些依賴視覺辨識的 APP 應用會從此失去競爭力，成為手機標配。

最後，今年被稱為史上最無趣的蘋果發表會後（不確定以後會不會更無趣），視覺智能將會大大影響互動設計的層面會超越其他多模態（multi-modal）行為。接下來就是期待手部辨識，能像iPhone 多重觸控（multi-touch）一樣，成為行動運算的標準，成為最後一張拼圖。

Apple introduces iPhone 16 and iPhone 16 Plus

———————–

這些你也許有興趣: