撰文者:黃子瑞
Google Veo 3 是 2025 年 Google I/O 大會上發表的最新一代 AI 影片生成模型。Veo 3 最大的技術亮點在於「聲畫同步」,它不僅能生成高畫質影片,還能產生對應的對話、背景音效與音樂,相較過往只能產生影像畫面的 AI 模型是一大技術突破。
Veo 3 的重點特色
Veo 3 能夠一次性生成聲音與畫面,並根據畫面生成對話、環境噪音、音效及背景音樂,帶來流暢自然的影音同步體驗。此外,Veo 3 能夠創造出更細膩的電影感畫面,它能真實呈現如天空的色澤變化、午後陽光照射水面的角度等細節。此外,Veo 3 更能模擬現實世界中的物理現象,使水面流動、光影變化及人物動作都能自然呈現,打造更具沉浸感與說服力的視覺作品。
全球瘋 AI 生成影片
Veo 3 推出後驚豔全球使用者,有多支 Veo 3 生成的影片在網路廣泛流傳,例如讓網紅穿越時空,在關鍵歷史時刻進行直播,或是讓影片中的接近真人的 AI 角色說出自己只是指令 (prompt) 的產物,這些影片都展現了這款工具的無限可能。 根據 Google 台灣部落格 7 月初的文章,在過去七週內,全球使用者已生成了超過四千萬部 Veo 3 影片。
逼真 AI 影片 可能被有心人士利用製作假訊息
由於 Veo 3 的生成結果非常逼真,也引發輿論討論其可能被誤用的風險。根據《TIME》雜誌的分析以及多個科技監督機構的觀察,Veo 3能夠生成具誤導性或煽動性的新聞片段。《TIME》利用 Veo 3 成功創建出一系列擬真影片,主題包含:美國選務人員在選舉時用違法的方式整理選票、巴基斯坦群眾焚燒印度廟宇。儘管這些影片都存在明顯破綻,但多位專家告訴《TIME》,如果這些影片在突發新聞事件中配上誤導性的標題並發布於社群媒體上,還是有可能導致社會動盪或暴力事件。
雖然文字生成影片的技術已存在多年,但 Veo 3 是一大進步,能夠創造幾乎與真實無異的 AI 影片。與先前如 OpenAI 的 Sora 等影片生成器不同,Veo 3 能自動配上對話、音樂及音效,並遵循物理規則,且幾乎沒有過去 AI 影像常見的瑕疵。專家擔憂像 Veo 3 這類工具的真正危險在於:它們將加速錯假訊息與宣傳的擴散,使人們更難分辨虛構與現實。
官方設下的保護措施
Veo 官方網站表示會封鎖「有害的請求與結果」。技術文件也指出,Veo 3 上線前經過了紅隊測試(red-teaming),也就是測試者試圖誘發工具產生有害性內容,Google 其後再加入輸出結果過濾器等額外防護機制。Google 也表示,所有 AI 生成的影片都會包含可見的浮水印,並嵌入名為 SynthID 的不可見數位浮水印,以清楚標示其為 AI 生成。
《TIME》在測試過程中也發現,Veo 3 確實會阻擋部分提示詞,特別是與移民或暴力相關的內容。例如,當《TIME》要求生成一段虛構颶風的畫面時,模型回應此類影片可能被誤認為真實事件,造成不必要的恐慌或混亂,因此拒絕生成。
結語
Veo 3 展現了 AI 技術在影音創作領域的驚人進步,讓一般使用者只需透過文字描述就能產出具電影質感的短片,為創意發想與影像敘事帶來前所未有的自由與可能。然而,這樣強大的工具若缺乏妥善監管,也可能成為錯假訊息、煽動性內容的溫床。如何在推動技術創新的同時,建立足夠的監管機制與倫理規範,將是未來 AI 發展中不可忽視的重要課題。唯有在創作自由與公共信任之間取得平衡,才能保持 AI 科技的永續發展。
免責聲明
本篇文章所述內容僅供資訊分享用途,旨在介紹 Google Veo 3 的技術發展與社會觀察,並不代表任何特定立場與企業。文中提及之 AI 影片生成功能、應用案例與第三方評論皆屬公開資料整理與評論彙編,其真實性與準確性請以原始來源為準。
讀者應自行判斷 Veo 3 或其他 AI 工具之使用風險與責任,並遵守各地相關法規與倫理規範。若因引用、模仿或誤用本文內容所產生之一切後果,本平台恕不負責。AI 技術仍在發展中,建議讀者持續關注官方公告與最新政策,審慎使用並共同維護資訊真實性與社會信任。
Reference
Veo 3 available for everyone in public preview on Vertex AI | Google Cloud Blog
Google's New AI Tool Generates Convincing Deepfakes of Riots, Conflict, and Election Fraud