字节跳动推出全新AI数字人模型,OmniHuman助力内容创作门槛大降

金融界 2025-02-07 08:57:50

2月6日,字节跳动数字人团队推出了新的多模态数字人方案OmniHuman,其可以对任意尺寸和人物占比的单张图片结合一段输入的音频进行视频生成,生成的人物视频效果生动,具有非常高的自然度。

业内人士表示,OmniHuman通过引入多模态条件驱动和全条件训练策略,成功解决了人类动画生成领域长期存在的数据扩展和泛化能力问题。这一发展出现在AI视频生成技术竞争日益激烈的背景下,谷歌、Meta和微软等公司也在积极追逐类似技术。

传统 AI 数字人模型多基于姿势驱动或音频驱动,OmniHuman 则可以基于单个人体图像和运动信号,如仅音频、仅视频或音频和视频的组合生成人体视频,极大地降低内容创作的门槛。个人用户、MCN 机构等都能利用它快速生成虚拟主播、虚拟偶像、虚拟客服、虚拟教育等各种形式的数字人内容,为商业化变现提供更多可能。

金融界提醒:本文内容、数据与工具不构成任何投资建议,仅供参考,不具备任何指导作用。股市有风险,投资需谨慎! 投诉
投资工具
每日热点资讯
5分钟了解今日热点资讯
相关推荐
腾讯发布并开源混元语音数字人模型
来源:格隆汇 8.00W
腾讯发布并开源混元语音数字人模型
来源:金融界 10
智谱华章申请数字人视频生成相关专利,确保生成视频中的动作与驱动音频的一致性
来源:金融界
悦享控股(CHR.US)旗下悦灵犀AI多模态引擎正式上线
来源:智通财经网
快手可灵AI上线2.1系列模型 打造视频生成性价比新标杆
来源:智通财经网
AI应用浪潮风靡全球! “OpenAI劲敌”Anthropic创收规模五个月翻三倍
来源:智通财经网
全部评论
没有评论,谈谈您的想法…
谈谈您的想法...
App内打开
打开App
推荐 要闻 7x24 理财 财 经 导航
undefined
取消
确认