顶部广告位图片 顶部广告位图片 顶部广告位图片

字节跳动推出全新AI数字人模型,OmniHuman助力内容创作门槛大降

金融界 2025-02-07 08:57:50
10秒看完全文要点
看要点

2月6日,字节跳动数字人团队推出了新的多模态数字人方案OmniHuman,其可以对任意尺寸和人物占比的单张图片结合一段输入的音频进行视频生成,生成的人物视频效果生动,具有非常高的自然度。

业内人士表示,OmniHuman通过引入多模态条件驱动和全条件训练策略,成功解决了人类动画生成领域长期存在的数据扩展和泛化能力问题。这一发展出现在AI视频生成技术竞争日益激烈的背景下,谷歌、Meta和微软等公司也在积极追逐类似技术。

传统 AI 数字人模型多基于姿势驱动或音频驱动,OmniHuman 则可以基于单个人体图像和运动信号,如仅音频、仅视频或音频和视频的组合生成人体视频,极大地降低内容创作的门槛。个人用户、MCN 机构等都能利用它快速生成虚拟主播、虚拟偶像、虚拟客服、虚拟教育等各种形式的数字人内容,为商业化变现提供更多可能。

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎! 投诉
每日热点资讯
5分钟了解今日热点资讯
相关推荐
中文在线:AI漫画动态漫已制作近百部作品,实现商业化连载和付费经营
来源:金融界 7.25W
亿道信息申请基于音频驱动的数字人生成方法相关专利,实现面部动画与音频的高同步
来源:金融界
IDC:预计到2029年 中国AI数字人市场规模将达到250.5亿元
来源:智通财经网
优酷文化科技申请三维人脸动画生成模型训练等专利,有效提高训练后的目标生成模型的泛化能力
来源:金融界
有了扣子,为何字节跳动还需要HiAgent
来源:钛媒体 24
拆解火山引擎后,我看到了字节跳动的「变奏」
来源:极客公园 8.50W
全部评论
没有评论,谈谈您的想法…
谈谈您的想法...
App内打开
打开App
推荐 要闻 7x24 理财 财 经 导航