首页 > 实用技巧 > 干货教程 > AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

AI视频进入有声时代!谷歌发布视频生成音频技术,效果惊艳网友!

发布时间:2024-06-19 22:58:06来源: 15210273549

Runway前脚刚发布Gen-3 Alpha,Google后脚就跟了个王炸。

 

北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐逼真的音效,甚至是人物之间的对话

 

V2A技术支持为AI生成视频“配乐”,Google还特别强调了官网发布的Demo视频都是由自家在五月份发布的生成视频模型“Veo”和V2A技术合作打造

 

有不少网友表示,这下终于可以给用Luma生成的meme视频配上声音了!

 

从Google Deepmind官网发布的Blog上看,V2A技术会采用视频像素文本提示来生成与底层视频同步的音频波形。

 

首先,V2A会对视频和文本提示进行编码,并通过扩散模型迭代运行,将随机噪声细化为与视频和所提供的文本提示相匹配的真实音频,最后再对音频进行解码并与视频数据相结合。

 

X网友纷纷表示太赞了,但就是有一个小小小小的问题,和同样是凌晨发布的Runway的视频生成模型Gen-3 Alpha一样,这

又是一个大家都用不上的超赞模型,到底啥时候开源让咱们试试水!

干货教程更多>>

定损14.7万,保司只愿赔付6.2万,4S高返点抢来的事故车砸手里了? 智能纯电性价比之王 试驾广汽丰田铂智3X 阿维塔11增配上市28.99万起,新增暗夜骑士版 仰望新车U8L亮相上海车展,全尺寸行政豪华SUV又大又豪 一汽丰田bZ5价格13-16万元 发布安全智能驾驶辅助新方案 2025年黄浦区穗东街道庙头社区合同制工作人员招聘公告(5人) 2025年广州市黄埔区大沙街横沙股份经济联合社第一次招聘公告(10人) 2025年广东技术师范大学招聘辅导员公告(40人) 2025年天河区卫生健康系统事业单位招聘专业技术人员公告(第一批)(105人) 2025年河北地质大学选聘工作人员公告 长安汽车:掌握新风向 Q版“保时捷”上市 2025款缤果它想重新定义代步车? 地平线的野心,落在了“HSD”上? 3月份竟然有合资车销量逆市疯涨,国人消费回归理性出“孤证”! 16.49万元起售,捷途全新山海L9上市 从稳定过万到月销不足三千,极氪王牌因何沉沦? 小米SU7宿命之敌,全新智己L6只缺一个爆点 韩系车领衔缺席2025上海车展,是掉队还是藏招 【何小鹏:小鹏X键支持自定义“Say Hi”功能下季度回归】 三星Galaxy A26 5G手机曝光:25W有线充电、支持双卡双待 广汽将成立子公司与华为合作,首款车型将颠覆市场,售价30万以上 埃安UT 480亿公里零自燃验证证的弹匣电池,全能安全更抗打 直播间搬进田间地头 00后网购年货热衷“混搭” 三款纯电小车近期上市,海豚、萤火虫领衔,都是代步好选择 仰望U8重磅OTA:城市领航开全国 新增暴力模式 丰田这次要掀桌子,15万级纯电SUV,带激光雷达+大模型智驾 累计销量55万辆,红旗H5缘何成为国产B级车标杆? 2025年1月,这20款新车已经开始降价 2024车市盘点:沃尔沃全年下滑8%,新能源车型遭冷落,危机重重 寒假带娃不再慌!大空间、强动力、高安全,瑞虎8L助你安心出行