I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

2024/05/15

by 布小白特約編輯

4473

留言

Google I/O 2024 開發者大會於今日（5/15）凌晨正式登場，在活動第一天的 Keynote 發表會上，Google 並未如預期發表 Android 15 作業系統，而是完全關注在 AI 相關技術最新發展，推出最新版 AI 模型 Gemini 1.5 Falsh / 1.5 Pro 與多項 AI 新功能，並表示持續將 AI 技術帶入 Android 系統與 Google 搜尋、相簿等功能當中，並預告正在以 AI 模型設計來電防詐功能。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

Gemini 發展現狀

針對生成式 AI 體驗上，Google 發表最新的 AI 模型 Gemini 1.5 Falsh / 1.5 Pro，兩個新模型突破 200 萬詞元脈絡窗口的技術限制，並已經在 200 多個國家與地區推出公開預覽版。Google 同時預告下一代 Gemma 2 模型，將進一步擁有 270 億個參數，效能可超越大兩倍的模型，還能在單一 TPUv5e 上運行。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

其中，Gemini 1.5 Pro 模型即日起開放 150 個以上國家與地區的 Gemini Advanced 訂閱者使用，將脈絡長度擴展到從一百萬個詞元起算，因此能理解龐大文件內容，包括處理長達一千五百頁的文件檔案，或是處理約 100 封電子郵件的摘要，未來將擴展到處理長達一小時的影片內容，或者超過三萬行的程式碼。

Gemini 1.5 Pro 開放透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 進行處理；Gemini 1.5 Pro 還提升影像理解能力，透過拍照與分析，就能提供菜餚食譜，或是作業問題解答；也能詢問 AI 機器人在相簿內撈某個照片細節，AI 還會分析相簿與彙整照片資料。

另外，Gemini 1.5 Flash 模型，專為高頻率的任務設計，能簡化工作流程、簡化擁有 AI 技術輔助的應用程式。

Gemini 也針對行動裝置設計相關使用體驗，目前「Android Studio」Android 平台整合式開發環境已導入 Gemini 模型，並預告今年稍晚將可使用 Gemini 1.5 Pro 支援的多模態輸入功能。

至於現有的 Google Pixel 8 Pro、SAMSUNG Galaxy S24 系列手機也將會啟用的 Gemini Nano 模型、AICore 系統服務，也將於今年稍晚會在更多行動裝置上出現。

Android 系統內建 AI

雖然 Google 沒有發表 Android 15 作業系統，但在 2024 I/O 開發者大會展示了 Android 系統能使用的 Google AI 各項功能；繩提到已經在 Google 多款 Pixel 手機、三星多款裝置上啟用的「畫圈搜尋」功能，現有 1 億多台裝置正在使用中，未來將擴展到更多裝置上，希望讓使用人數在年底翻倍至 2 億以上。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

Android 作業系統已經導入的 Gemini AI 助理，未來將開放在使用的應用程式喚出的附加功能，以及相關串流使用體驗，像是能在 YouTube 影片中點擊「詢問有關這部影片的問題」來進行提問，或是把生成圖片拖放到 Gmail、Google 訊息和其他地方。如果是 Gemini Advanced 訂閱者，還能在行動裝置上透過「詢問有關這個 PDF 的問題」選項，無須自己翻頁就能獲解答。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

Google 同時預告今年稍晚，將從 Google Pixel 機種開始，讓 Gemini Nano 模型擁有全面多模態功能，從基本的文字處理，進階到還能理解影像、聲音和口說對話等更多內容，以及與上下文相關的資訊。

前述技術更新能體現在提升 TalkBack 輔助等功能上，以 TalkBack 功能來說，新 AI 技術就可彌補影像資訊不全的問題，幫助視障使用者獲得更豐富、更清晰的影像描述，且是直接在 Android 裝置上運作，沒有網路也能使用。

Google 並透露 Android 作業系統的 Gemini Nano 模型正在測試一項防詐騙新功能，當用戶在通話時，當 Gemini Nano 模型偵測到與詐騙有關的對話模式，像是不常見的銀行要求、要求緊急轉帳、使用禮品卡付款等敘述，或是要提供 PIN 碼或密碼等個人資訊，系統就會跳出警報。前述警報功能目前還在開發當中，預計今年稍晚會再公布更多資訊。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

▲Android 作業系統未來有望透過 Gemini Nano 模型提供來電警示功能。

AI 新功能

Gemini Live

Google 將 AI 模型 Gemini 導入 Google 訊息功能內，推出名為「Gemini Live」對話式 AI 體驗，讓用戶 Google 訊息上回復訊息時，同步跟 Gemini 進行語音聊天、互動；系統提供多樣化的自然人聲可供選擇，用戶能以自己習慣語速跟 Gemini 交談，也能跟日常對話一樣打斷 Gemini 回應，來詢問額外問題。「Gemini Live」將於未來幾中開放 Gemini Advanced 訂閱者使用。

動態規劃體驗

Gemini Advanced 服務更新其旅行規劃設計功能，推出新的動態規劃體驗，不再像以往顯示一串建議活動清單，而是進一步量身訂做適合的行程。系統會同步從 Gmail 撈取航班資訊、結合 Google 地圖推薦飯店附近餐廳與景點，再結合飲食偏好、當地旅遊資訊、移動距離與時間等資訊，搭造出個人化旅遊行程推薦，並可隨時進行變更暨，系統會隨時更新行程。Gemini Advanced 新動態規劃體驗將於未來幾個月推出。

個人化 Gemini

Google 也將開放 Gemini Advanced 服務訂閱者將所使用的 Gemini 模型進行個人化處理，將其稱為「Gem」，系統依照使用需求，只需要描述你希望 Gem 能完成什麼任務，以及想要的回應風格，就能將其打造成專屬健身夥伴、廚房助手，或是編寫程式碼夥伴。

與更多 Google 應用連結

Google 持續將 Gemini 與現有 Google 應用服務做串聯，像是 YouTube Music 擴充功能，就可藉由 Gemini 模型探索更多音樂；之後，Gemini 模型也將再導入 Google 日曆、Google Tasks 和 Google Keep 等應用程式與服務當中，像是拍下課表就能於日曆產生對應行事曆，或是拍下食譜就會在 Keep 內產生購物清單。上述新服務將即日起開放給企業客戶搶先使用。

AI 總覽

Google 之前已嘗試把 Gemini 模型與搜尋服務進行結合，並於 Search Labs 中推出實驗型 AI 總覽功能；前述功能稍早推出正式版本，即日起開放美國使用者嘗鮮，後續將再擴展到更多國家與地區。

同時，Google 也提出多項 AI 總覽新功能，像是 AI 摘要開放手動簡化語言或更詳細地分解內容等調整；可分析連續複雜問題、客製化備餐與旅程規劃的多步驟推理功能；對沒有單一解答的問題，Google 搜尋會利用生成式 AI 一起腦力激盪，搜尋結果頁面也會以 AI 技術整理分類。

另外，還新增一項名為「Ask with video」的影片辨識功能，用戶能錄製短片並詢問 AI 機器人，AI 功能就會辨識影片內容與使用者文體，並進行解答。上述功能將先於 Search Labs 上陸續開放使用，但初步只先開放美國地區使用者，以英文進行操作。

Workspace 相關應用

Workspace 企業應用程式與協作工具底下的 Gmail、Google 文件、雲端硬碟、Google 簡報和 Google 試算表中的側邊面板功能也開始使用 Gemini 1.5 Pro 模型，能夠回答更豐富多元的問題。Workspace Labs 和 Gemini for Workspace Alpha 使用者，即日起開始使用 Workspace 側邊面板中的 Gemini；而企業和個人使用者則從 6 月開始，能在電腦上透過 Workspace 專用 Gemini 外掛程式和 Google One AI 進階版方案使用這些功能。

I/O 2024登場！Google發表哪些AI新功能？一次帶你看懂

Workspace 版 Gmail 行動應用程式還支援郵件摘要、智慧回覆內容、Gmail 問答等 AI 功能，其中郵件摘要功能預計 5 月開始讓 Workspace Labs 用戶使用，6 月讓 Workspace 專用 Gemini 客戶以及 Google One AI 進階版方案的訂閱用戶者使用。智慧回覆內容、Gmail 問答則是 7 月開放 Workspace Labs 用戶，可在行動版和網路版的 Gmail 使用該服務。

Workspace 專用 Gemini 還新增名為「AI Teammate」功能，能創立一個 AI 同事，還能將 AI 同事加入其他對話中，透過撈取 Workspace 資訊來答覆所有問題。同時 Workspace 專用 Gemini 的更多功能將支援多國語言；其中，桌機版的 Gmail 和 Google 文件的「幫我撰寫」功能，未來幾週也將開放支援西班牙文和葡萄牙文。未來也將會持續增加更多支援語言。