撰文者:黃子瑞
2025 年 3 月 25 日,OpenAI 正式宣布其旗艦語言模型 GPT-4o 全面整合原生圖片生成能力,為 ChatGPT 用戶帶來更先進的 AI 生成圖片功能。即日起,圖片生成將成為 ChatGPT 內建功能,免費用戶、Plus 訂閱者、Pro 專業用戶、Team 團隊帳戶皆可直接使用,Enterprise 企業版與 Edu 教育版也將於近日開放。此外,GPT‑4o 的圖片生成功能亦將同步整合於 OpenAI 的影片生成平台 Sora,並計畫於未來數週開放 API 使用者串接應用。
用戶只需透過自然語言對話描述想要的圖片內容,即可快速生成高品質圖片,而且還支援指定長寬比例、透明背景、色碼(HEX)等細節條件設定。
本次更新功能亮點
與過去 OpenAI 所推出的 DALL·E 模型相比,GPT‑4o 圖片生成不只是風格多元,更具備以下全方位升級功能:
- 原生整合,對話式創作體驗更直覺
圖片生成能力直接內建於 GPT-4o 模型架構中,無需切換模組或介面,用戶可透過對話進行多輪圖片調整、修改與完善。 - 上下文學習與圖文結合能力強化
可即時分析使用者對話脈絡與上傳圖片內容,將其融入圖片生成,支援「以圖生圖」、「圖文轉換」等應用情境,顯著超越 DALL·E 模型的單一輸入能力。 - 準確渲染文本,解決 DALL·E 易出現的文字錯亂問題
GPT-4o 能精準生成圖片中的標誌、街牌、菜單、邀請函等文字,特別適合用於行銷素材、資訊圖表與教育海報等場景。 - 可控制性與細節表現更高
支援生成多達 10–20 個物件與其屬性,強化「物件-屬性-關係」的準確綁定,大幅改善 DALL·E 在複雜圖片生成時常見的誤解與混淆問題。 - 支援多風格與高寫實畫面
無論是攝影寫實、數位插畫、明信片風、懷舊膠卷感、手繪科學海報等,皆能根據語意呈現一致且可信的風格轉換,並提供如漸層轉換、陰影擬真、微光特效等細節處理。 - 進階應用場景拓展:遊戲設計、角色草圖、品牌素材製作
在遊戲角色生成中可維持角色外觀一致性;在品牌設計中支援 Logo、字體與排版細節強化,是內容創作者與設計人員的絕佳工具。
「吉卜力風」熱潮使 ChatGPT 新用戶數暴增
本次的 ChatGPT 圖片生成功能推出後,因其可將用戶上傳的照片轉變成指定的藝術風格,在臺灣及全球都掀起一股「吉卜力風」熱潮。其操作方式也相當容易:
1.在 ChatGPT 官網或 App 上傳一張清晰的人物或寵物照片
2.輸入指令「請將照片轉變成吉卜力風格。」
3.稍候一下即可得到成果
根據路透社 4 月 1 日報導,本次的熱潮使 OpenAI 的聊天機器人使用量創下歷史新高,也導致伺服器負載過重,一度限制該功能的使用。根據市場調查公司 Similarweb 的數據,ChatGPT 平均每週活躍用戶數於三月底首度突破 1.5 億人次。OpenAI 執行長 Sam Altman 更在社群平台 X 發文指出:「我們在過去一小時內就新增了一百萬名用戶」,對比兩年前 ChatGPT 剛推出時,達成百萬用戶仍需花費五天時間。市場分析公司 SensorTower 進一步指出,三月底 ChatGPT 的活躍用戶、App 下載量與 App 內訂閱收入皆創歷史新高。根據該公司數據,ChatGPT App 的全球下載量較前三月底成長 11%,每週活躍用戶數增加 5%,App 內購收入亦提升 6%。
然而,由於圖片生成功能的爆紅導致平台流量激增,ChatGPT 近期也出現數次小規模當機與錯誤。OpenAI 聯合創辦人發文表示:「我們正在逐步穩定系統,但大家應該預期未來 OpenAI 新功能推出會有所延遲,可能會出現 bug,服務速度也可能會較慢,這是我們應對容量挑戰的過程。」
吉卜力風格的著作權侵權爭議
大量使用 AI 工具生成「吉卜力風格」圖片的現象,也引發著作權爭議。路透社的報導中採訪了律師事務所 Neal & McDevitt 合夥人 Evan Brown ,他表示:「AI 生成圖片模仿吉卜力風格的法律風險處在模糊地帶。著作權法通常只保護具體表現形式,而非藝術風格本身。」
而截至目前 OpenAI 尚未就其 AI 模型的訓練資料及圖片生成功能的合法性做出回應,美聯社 3 月 28 日的報導中指出,根據 OpenAI 發表的技術文件,該公司表示在模仿特定藝術家風格時,會採取「保守策略」。文件指出:「當使用者試圖生成在世藝術家風格的圖片時,系統會自動啟動拒絕機制。」不過公司補充道:「我們允許使用者廣泛模仿『工作室風格』,這也促成了許多令人驚豔且具啟發性的原創粉絲創作。」
針對此次爭議,吉卜力工作室婉拒回應,然而,根據 CNN 報導,網路上流傳一段吉卜力工作室聯合創辦人宮崎駿在 2016 年針對 AI 圖片的批評影片。宮崎駿向來以手繪逐格動畫出名,他在影片中表示這類 AI 作品是「對生命本身的侮辱」。「我感到極度厭惡,」他在觀看某段 AI 生成怪物角色影片後說道。「如果你真的想創造這種詭異的東西,那你自己去做,但我絕不會想把這種技術納入我的創作中。」
我國經濟部立場:AI 抄襲或模仿風格若有爭議 由法院個案認定
中央社於 3 月 31 日的報導中採訪了經濟部智慧財產局,其表示,大量利用他人著作訓練生成式 AI ,是否為合理使用尚待釐清,建議開發者應取得權利人的同意或授權。此外,AI 大量模仿藝術家風格不涉及著作權侵權,但對 AI 是抄襲表達方式或模仿風格若有爭議,仍須由法院個案認定。
智慧局提到,已舉辦生成式 AI 與著作權議題討論研討會,並持續追蹤國際間的討論情形及實務發展。由於智慧財產為高度國際調和事項,AI 與著作權法制涉及層面廣泛,如何在保護著作權人利益與 AI 產業發展間取得平衡,須審慎因應。
結語
隨著 GPT-4o 圖片生成技術的問世,OpenAI 為生成式 AI 的應用開啟了更直覺、靈活的創作新時代。然而,這波「吉卜力風」風潮,也引起了關於生成式 AI 的著作權討論。當前法律對「風格」是否構成著作權保護尚無定論。不過,我國政府也正持續關注相關議題。未來如何在保護創作者權益與促進 AI 產業創新進步之間取得平衡,將是政策制定者與科技產業需共同思考的重要課題。
📌 免責聲明:
本文內容僅供參考與資訊分享之用。文中所提及的 AI 圖像生成功能僅限於技術描述,實際使用時仍應遵守平台規範與各國著作權法令。若用戶透過生成式 AI 所產出之圖像涉及特定藝術風格或名人肖像,建議使用者應審慎評估是否涉及智慧財產權或肖像權等爭議。相關法律責任應由使用者自行承擔。
Reference
Ghibli effect: ChatGPT usage hits record after rollout of viral feature | Reuters
ChatGPT's viral Studio Ghibli-style images highlight AI copyright concerns | AP News