如同最近一年 DALL-E 2、Stable Diffusion 等文本生成圖像模型發(fā)展一樣,用文本來生成視頻的 AI 工具也正變得越來越多。
繼 Meta 的 Make-A-Video 之后,谷歌也接連發(fā)布了兩款視頻模型 Imagen Video 和 Phenaki。兩者分別強調視頻的質量和長度等不同功能。
日前,在人工智能活動上,首次發(fā)布了由 Imagen Video 和 Phenaki 一同生成的視頻。該視頻結合了 Phenaki 生成長視頻能力和 Imagen 的高分辨率細節(jié)。
(來源:谷歌)
“我認為使用一系列提示,創(chuàng)造這樣的超分辨率長視頻令人難以置信,這是一種講故事的新方式,”谷歌研究中心首席科學家兼谷歌大腦團隊研究總監(jiān)道格拉斯·???)在活動中分享說,“很期待電影人或視頻故事講述者如何利用我們的技術。”
在官方博客中表示,Imagen Video 和 Phenaki 的結合是一項重要突破,它正在努力打造領先行業(yè)、能生成高質量影響的工具。AI 驅動的生成模型有著無限的創(chuàng)造力,可幫助人們借助視頻、圖像工具,以他們之前無法做到的方式充分表達自身想法。
再分別簡單介紹下 Imagen Video 和 Phenaki。
據(jù)了解,Imagen Video 基于級聯(lián)視頻擴散模型來生成高清視頻。如輸入文本提示后,基本視頻擴散模型和多個時間超分辨率(Temporal Super-Resolution,TSR)及空間超分辨率(Spatial Super-Resolution,SSR)模型,分別以 40×24 像素和 3 幀/秒速度生成 16 幀視頻、以 1280×768 像素和 24 幀/秒的速度采樣,最終得到 5.3 秒的高質量視頻。
關鍵詞: 谷歌兩款視頻模型 兩款視頻模型 視頻模型 人工智能活動視頻模型 人工智能活動
凡注有"環(huán)球傳媒網(wǎng)"或電頭為"環(huán)球傳媒網(wǎng)"的稿件,均為環(huán)球傳媒網(wǎng)獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環(huán)球傳媒網(wǎng)",并保留"環(huán)球傳媒網(wǎng)"的電頭。
- 2022騰訊科學WE大會十周年如期舉行 希望助力基礎科學普及
- 部分用戶反饋Face ID出現(xiàn)問題 iOS 16又出新Bug?
- Intel處理器“內購”功能定名Intel On Demand 氪金解鎖更多性能
- 疑似Navi 31大核心的RDNA3架構GPU"玉照"搶先曝光
- 老外不想看到它?三星Exynos 2300至今未露面
- 摩爾線程國產MTT S80游戲卡開賣:16GB GDDR6顯存
- 正帆科技688596:截至9月底在手訂單為31億元 同比增長63.7%
- NVIDIA的GTX 1060占比達到7.62% 份額回升到了近幾個月的最高點
- 中國聯(lián)通、騰訊設立混改新公司 雙方均未評論
- 小米索尼聯(lián)合研發(fā)索尼IMX989 共同推動移動影像的進步
資訊
焦點
- 首次超過美國 全球最佳大學排行榜:338所中國大學上榜
- Meta市值縮水至2017年水平 扎克伯格身價排名跌出全球前十
- “雙11”成立自營物流公司 菜鳥回應:消息不實
- 瑞信(CS.US)CEO發(fā)表備忘錄 試圖讓市場相信其財務穩(wěn)定性
- 財務大臣重申捍衛(wèi)日元立場 日本央行9月政策會議摘要提及政策轉向
- 英國迎來黃金搶購潮 新政府“迷你預算”刮起恐慌風暴
- 高盛:美國家庭和外國投資者將分別凈拋售1000億美元股票
- 違約概率飆升至至少10年來最高水平 百年銀行巨頭瑞信被傳“爆雷”!
- 美聯(lián)儲在加息速度問題上已現(xiàn)分歧 市場Q4能否扭轉頹勢?
- 進一步加碼全球黃油市場 威士蘭乳業(yè)收購新西蘭乳企Canary Foods