首页动态消费创业汽车商业房产互联网纵横聚焦快讯热点

资讯 > 纵横 >

资讯 > 纵横 >

让蒙娜丽莎唱饶舌，微软发布 VASA-1 模型：图 + 音频可生成短视频

来源：IT之家发布时间：2024-04-19 14:59:48

微软亚洲研究院（Microsoft Research Asia）近日发表论文，介绍了全新的 VASA-1 模型，用户只需要提供一张静态肖像图片和一段语音音频片段，该模型就能自动让图片中的人物自动说话。

VASA-1 特别有趣的地方在于，它能够模拟自然的面部表情、各种情绪和唇部同步，最重要的是几乎没有人工痕迹，如果不细看很难发现。

研究人员承认，与所有其他模型一样，该模型目前还无法妥善处理头发等非刚性元素，但整体效果要比其它同类模型要更为优秀。

研究人员还表示 VASA-1 支持离线 batch 处理模式下，以 45fps 生成分辨率为 512*512 的动态短视频，在线直播模式下可以达到 40 fps，且延迟仅为 170ms。而且整个生成操作只需要一台配备英伟达 RTX 4090 显卡的电脑上就能处理。

关键词：

责任编辑：FG003

上一篇：新型储能行业需回归技术创新主航道今日热文

下一篇：最后一页

频道精选

让蒙娜丽莎唱饶舌，微软发布 VASA-1 模型：图 + 音频可生成短视频2024-04-19 14:59:48
新型储能行业需回归技术创新主航道今日热文2024-04-19 13:23:35
邓州市住房公积金管理中心：优化营商环境提供增值服务2024-04-18 18:29:50
西平县柏苑街道开展反诈集中宣传“严防电诈骗局共创美好明天” 短讯2024-04-16 16:43:25
Used 56 Seats Bus_全球实时2024-04-13 21:46:30

驻马店市驿城区古城街道：铁路安全记于心爱路护路践于行2024-04-12 18:05:07
【环球快播报】加强审判质量指标监管提升审判管理水平——息县法院举行审判质效管理指标体系培训会2024-04-12 17:18:20
西峡法院：警执联动 “执” 击民生|全球信息2024-04-12 08:31:50
世界资讯：驻马店市驿城区新华街道开展第三十六个爱国卫生宣传月活动2024-04-10 16:13:41
同兴资本：携手前行，共创财富新篇章|微速讯2024-04-10 14:47:43

让蒙娜丽莎唱饶舌，微软发布 VASA-1 模型：图 + 音频可生成短视频

让蒙娜丽莎唱饶舌，微软发布 VASA-1 模型：图 + 音频可生成短视频

新型储能行业需回归技术创新主航道今日热文

新型储能行业需回归技术创新主航道今日热文

热门资讯

进一步完善新能源汽车保险邓州市：培育学法用法示范户优化法治化好环境【时快讯】以“演”促防以“练”备汛驻马店开发区城市管理局开展城市道路排水抢险演练驻马店市生态环境局西平分局：“环保绿”化身“志愿红”做文明的守护者遂平县文城乡群众齐参与整治人居环境天天资讯遂平县阳丰镇召开2024年禁种铲毒工作推进会新野县财政局：学习传承焦裕禄精神凝聚起干事创业强大动力息县：田间管理齐发力保障夏粮丰产丰收_全球视讯全球热头条丨伊朗伊斯兰革命卫队：一定对以色列袭击作出回应

最新资讯

网站首页 | 关于我们 | 免责声明 | 联系我们

所有文章、评论、信息、数据仅供参考，使用前请核实，风险自负。

Copyright 2013-2020 高陵经济网版权所有京ICP备2022016840号-34

联系邮箱：920 891 263@qq.com glxcb.cn All Rights Reserved