Google I/O 2024 開發者大會於今日(5/15)凌晨正式登場,在活動第一天的 Keynote 發表會上,Google 並未如預期發表 Android 15 作業系統,而是完全關注在 AI 相關技術最新發展,推出最新版 AI 模型 Gemini 1.5 Falsh / 1.5 Pro 與多項 AI 新功能,並表示持續將 AI 技術帶入 Android 系統與 Google 搜尋、相簿等功能當中,並預告正在以 AI 模型設計來電防詐功能。
其中,Gemini 1.5 Pro 模型即日起開放 150 個以上國家與地區的 Gemini Advanced 訂閱者使用,將脈絡長度擴展到從一百萬個詞元起算,因此能理解龐大文件內容,包括處理長達一千五百頁的文件檔案,或是處理約 100 封電子郵件的摘要,未來將擴展到處理長達一小時的影片內容,或者超過三萬行的程式碼。
Gemini 1.5 Pro 開放透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 進行處理;Gemini 1.5 Pro 還提升影像理解能力,透過拍照與分析,就能提供菜餚食譜,或是作業問題解答;也能詢問 AI 機器人在相簿內撈某個照片細節,AI 還會分析相簿與彙整照片資料。
另外,Gemini 1.5 Flash 模型,專為高頻率的任務設計,能簡化工作流程、簡化擁有 AI 技術輔助的應用程式。
Gemini 也針對行動裝置設計相關使用體驗,目前「Android Studio」Android 平台整合式開發環境已導入 Gemini 模型,並預告今年稍晚將可使用 Gemini 1.5 Pro 支援的多模態輸入功能。
至於現有的 Google Pixel 8 Pro、SAMSUNG Galaxy S24 系列手機也將會啟用的 Gemini Nano 模型、AICore 系統服務,也將於今年稍晚會在更多行動裝置上出現。
Android 作業系統已經導入的 Gemini AI 助理,未來將開放在使用的應用程式喚出的附加功能,以及相關串流使用體驗,像是能在 YouTube 影片中點擊「詢問有關這部影片的問題」來進行提問,或是把生成圖片拖放到 Gmail、Google 訊息和其他地方。如果是 Gemini Advanced 訂閱者,還能在行動裝置上透過「詢問有關這個 PDF 的問題」選項,無須自己翻頁就能獲解答。
Google 同時預告今年稍晚,將從 Google Pixel 機種開始,讓 Gemini Nano 模型擁有全面多模態功能,從基本的文字處理,進階到還能理解影像、聲音和口說對話等更多內容,以及與上下文相關的資訊。
前述技術更新能體現在提升 TalkBack 輔助等功能上,以 TalkBack 功能來說,新 AI 技術就可彌補影像資訊不全的問題,幫助視障使用者獲得更豐富、更清晰的影像描述,且是直接在 Android 裝置上運作,沒有網路也能使用。
Google 並透露 Android 作業系統的 Gemini Nano 模型正在測試一項防詐騙新功能,當用戶在通話時,當 Gemini Nano 模型偵測到與詐騙有關的對話模式,像是不常見的銀行要求、要求緊急轉帳、使用禮品卡付款等敘述,或是要提供 PIN 碼或密碼等個人資訊,系統就會跳出警報。前述警報功能目前還在開發當中,預計今年稍晚會再公布更多資訊。
▲Android 作業系統未來有望透過 Gemini Nano 模型提供來電警示功能。
Google 也將開放 Gemini Advanced 服務訂閱者將所使用的 Gemini 模型進行個人化處理,將其稱為「Gem」,系統依照使用需求,只需要描述你希望 Gem 能完成什麼任務,以及想要的回應風格,就能將其打造成專屬健身夥伴、廚房助手,或是編寫程式碼夥伴。
同時,Google 也提出多項 AI 總覽新功能,像是 AI 摘要開放手動簡化語言或更詳細地分解內容等調整;可分析連續複雜問題、客製化備餐與旅程規劃的多步驟推理功能;對沒有單一解答的問題,Google 搜尋會利用生成式 AI 一起腦力激盪,搜尋結果頁面也會以 AI 技術整理分類。
另外,還新增一項名為「Ask with video」的影片辨識功能,用戶能錄製短片並詢問 AI 機器人,AI 功能就會辨識影片內容與使用者文體,並進行解答。上述功能將先於 Search Labs 上陸續開放使用,但初步只先開放美國地區使用者,以英文進行操作。
Workspace 版 Gmail 行動應用程式還支援郵件摘要、智慧回覆內容、Gmail 問答等 AI 功能,其中郵件摘要功能預計 5 月開始讓 Workspace Labs 用戶使用,6 月讓 Workspace 專用 Gemini 客戶以及 Google One AI 進階版方案的訂閱用戶者使用。智慧回覆內容、Gmail 問答則是 7 月開放 Workspace Labs 用戶,可在行動版和網路版的 Gmail 使用該服務。
Workspace 專用 Gemini 還新增名為「AI Teammate」功能,能創立一個 AI 同事,還能將 AI 同事加入其他對話中,透過撈取 Workspace 資訊來答覆所有問題。同時 Workspace 專用 Gemini 的更多功能將支援多國語言;其中,桌機版的 Gmail 和 Google 文件的「幫我撰寫」功能,未來幾週也將開放支援西班牙文和葡萄牙文。未來也將會持續增加更多支援語言。
另外,Imagen 3、、Music AI Sandbox、Veo 則分別是生成式圖片、生成式音樂與生成式影片的 AI 工具。
現在,你也可以同步追蹤我們的 Google 新聞、LINE TODAY 頻道,掌握《SOGI 手機王》最新發布的訊息。
▲只要訂閱《SOGI 手機王》就可以第一時間掌握最新的數位科技資訊、個人化專屬推播及優惠活動。
Gemini 發展現狀
針對生成式 AI 體驗上,Google 發表最新的 AI 模型 Gemini 1.5 Falsh / 1.5 Pro,兩個新模型突破 200 萬詞元脈絡窗口的技術限制,並已經在 200 多個國家與地區推出公開預覽版。Google 同時預告下一代 Gemma 2 模型,將進一步擁有 270 億個參數,效能可超越大兩倍的模型,還能在單一 TPUv5e 上運行。其中,Gemini 1.5 Pro 模型即日起開放 150 個以上國家與地區的 Gemini Advanced 訂閱者使用,將脈絡長度擴展到從一百萬個詞元起算,因此能理解龐大文件內容,包括處理長達一千五百頁的文件檔案,或是處理約 100 封電子郵件的摘要,未來將擴展到處理長達一小時的影片內容,或者超過三萬行的程式碼。
Gemini 1.5 Pro 開放透過 Google 雲端硬碟或直接從裝置上傳檔案到 Gemini Advanced 進行處理;Gemini 1.5 Pro 還提升影像理解能力,透過拍照與分析,就能提供菜餚食譜,或是作業問題解答;也能詢問 AI 機器人在相簿內撈某個照片細節,AI 還會分析相簿與彙整照片資料。
另外,Gemini 1.5 Flash 模型,專為高頻率的任務設計,能簡化工作流程、簡化擁有 AI 技術輔助的應用程式。
Gemini 也針對行動裝置設計相關使用體驗,目前「Android Studio」Android 平台整合式開發環境已導入 Gemini 模型,並預告今年稍晚將可使用 Gemini 1.5 Pro 支援的多模態輸入功能。
至於現有的 Google Pixel 8 Pro、SAMSUNG Galaxy S24 系列手機也將會啟用的 Gemini Nano 模型、AICore 系統服務,也將於今年稍晚會在更多行動裝置上出現。
Android 系統內建 AI
雖然 Google 沒有發表 Android 15 作業系統,但在 2024 I/O 開發者大會展示了 Android 系統能使用的 Google AI 各項功能;繩提到已經在 Google 多款 Pixel 手機、三星多款裝置上啟用的「畫圈搜尋」功能,現有 1 億多台裝置正在使用中,未來將擴展到更多裝置上,希望讓使用人數在年底翻倍至 2 億以上。Android 作業系統已經導入的 Gemini AI 助理,未來將開放在使用的應用程式喚出的附加功能,以及相關串流使用體驗,像是能在 YouTube 影片中點擊「詢問有關這部影片的問題」來進行提問,或是把生成圖片拖放到 Gmail、Google 訊息和其他地方。如果是 Gemini Advanced 訂閱者,還能在行動裝置上透過「詢問有關這個 PDF 的問題」選項,無須自己翻頁就能獲解答。
Google 同時預告今年稍晚,將從 Google Pixel 機種開始,讓 Gemini Nano 模型擁有全面多模態功能,從基本的文字處理,進階到還能理解影像、聲音和口說對話等更多內容,以及與上下文相關的資訊。
前述技術更新能體現在提升 TalkBack 輔助等功能上,以 TalkBack 功能來說,新 AI 技術就可彌補影像資訊不全的問題,幫助視障使用者獲得更豐富、更清晰的影像描述,且是直接在 Android 裝置上運作,沒有網路也能使用。
Google 並透露 Android 作業系統的 Gemini Nano 模型正在測試一項防詐騙新功能,當用戶在通話時,當 Gemini Nano 模型偵測到與詐騙有關的對話模式,像是不常見的銀行要求、要求緊急轉帳、使用禮品卡付款等敘述,或是要提供 PIN 碼或密碼等個人資訊,系統就會跳出警報。前述警報功能目前還在開發當中,預計今年稍晚會再公布更多資訊。
▲Android 作業系統未來有望透過 Gemini Nano 模型提供來電警示功能。
AI 新功能
Gemini Live
Google 將 AI 模型 Gemini 導入 Google 訊息功能內,推出名為「Gemini Live」對話式 AI 體驗,讓用戶 Google 訊息上回復訊息時,同步跟 Gemini 進行語音聊天、互動;系統提供多樣化的自然人聲可供選擇,用戶能以自己習慣語速跟 Gemini 交談,也能跟日常對話一樣打斷 Gemini 回應,來詢問額外問題。「Gemini Live」將於未來幾中開放 Gemini Advanced 訂閱者使用。動態規劃體驗
Gemini Advanced 服務更新其旅行規劃設計功能,推出新的動態規劃體驗,不再像以往顯示一串建議活動清單,而是進一步量身訂做適合的行程。系統會同步從 Gmail 撈取航班資訊、結合 Google 地圖推薦飯店附近餐廳與景點,再結合飲食偏好、當地旅遊資訊、移動距離與時間等資訊,搭造出個人化旅遊行程推薦,並可隨時進行變更暨,系統會隨時更新行程。Gemini Advanced 新動態規劃體驗將於未來幾個月推出。個人化 Gemini
Google 也將開放 Gemini Advanced 服務訂閱者將所使用的 Gemini 模型進行個人化處理,將其稱為「Gem」,系統依照使用需求,只需要描述你希望 Gem 能完成什麼任務,以及想要的回應風格,就能將其打造成專屬健身夥伴、廚房助手,或是編寫程式碼夥伴。
與更多 Google 應用連結
Google 持續將 Gemini 與現有 Google 應用服務做串聯,像是 YouTube Music 擴充功能,就可藉由 Gemini 模型探索更多音樂;之後,Gemini 模型也將再導入 Google 日曆、Google Tasks 和 Google Keep 等應用程式與服務當中,像是拍下課表就能於日曆產生對應行事曆,或是拍下食譜就會在 Keep 內產生購物清單。上述新服務將即日起開放給企業客戶搶先使用。AI 總覽
Google 之前已嘗試把 Gemini 模型與搜尋服務進行結合,並於 Search Labs 中推出實驗型 AI 總覽功能;前述功能稍早推出正式版本,即日起開放美國使用者嘗鮮,後續將再擴展到更多國家與地區。同時,Google 也提出多項 AI 總覽新功能,像是 AI 摘要開放手動簡化語言或更詳細地分解內容等調整;可分析連續複雜問題、客製化備餐與旅程規劃的多步驟推理功能;對沒有單一解答的問題,Google 搜尋會利用生成式 AI 一起腦力激盪,搜尋結果頁面也會以 AI 技術整理分類。
另外,還新增一項名為「Ask with video」的影片辨識功能,用戶能錄製短片並詢問 AI 機器人,AI 功能就會辨識影片內容與使用者文體,並進行解答。上述功能將先於 Search Labs 上陸續開放使用,但初步只先開放美國地區使用者,以英文進行操作。
Workspace 相關應用
Workspace 企業應用程式與協作工具底下的 Gmail、Google 文件、雲端硬碟、Google 簡報和 Google 試算表中的側邊面板功能也開始使用 Gemini 1.5 Pro 模型,能夠回答更豐富多元的問題。Workspace Labs 和 Gemini for Workspace Alpha 使用者,即日起開始使用 Workspace 側邊面板中的 Gemini;而企業和個人使用者則從 6 月開始,能在電腦上透過 Workspace 專用 Gemini 外掛程式和 Google One AI 進階版方案使用這些功能。Workspace 版 Gmail 行動應用程式還支援郵件摘要、智慧回覆內容、Gmail 問答等 AI 功能,其中郵件摘要功能預計 5 月開始讓 Workspace Labs 用戶使用,6 月讓 Workspace 專用 Gemini 客戶以及 Google One AI 進階版方案的訂閱用戶者使用。智慧回覆內容、Gmail 問答則是 7 月開放 Workspace Labs 用戶,可在行動版和網路版的 Gmail 使用該服務。
Workspace 專用 Gemini 還新增名為「AI Teammate」功能,能創立一個 AI 同事,還能將 AI 同事加入其他對話中,透過撈取 Workspace 資訊來答覆所有問題。同時 Workspace 專用 Gemini 的更多功能將支援多國語言;其中,桌機版的 Gmail 和 Google 文件的「幫我撰寫」功能,未來幾週也將開放支援西班牙文和葡萄牙文。未來也將會持續增加更多支援語言。
更多 AI 功能
Google I/O 開發者大會同步推出包括 Project Astra、Imagen 3、Veo、Music AI Sandbox 等 AI 新功能。其中,Project Astra 能讓用戶拿起手機或是戴起智慧眼鏡,以裝置上鏡頭拍攝環境,並即時透過語音操作 AI 機器人來識別特定物體,系統甚至會記錄之前拍過哪些物體,而反過頭尋找。另外,Imagen 3、、Music AI Sandbox、Veo 則分別是生成式圖片、生成式音樂與生成式影片的 AI 工具。
訂閱手機王,快速掌握 Google 消息
想快速知道 Google 消息或相關優惠嗎?趕緊依照下圖指示,點選「允許」通知,之後有最新熱門機型的價格資訊時,你就不會錯過啦!(沒收到訂閱通知?點我看如何開啟)現在,你也可以同步追蹤我們的 Google 新聞、LINE TODAY 頻道,掌握《SOGI 手機王》最新發布的訊息。
Sponsor
曾任手機王編輯4年,也曾於時尚雜誌短暫嘗試數編/採編/責編的斜槓人生,手機常備4款修圖軟體+8款手遊
本文相關商品
相關新聞
2024/03/26
最新消息
2024/11/08
2024/11/08
熱門新聞
2024/11/02
2024/11/01
留言