字节Seed开源统一多模态理解和生成模型BAGEL

[复制链接]
周大 发表于 4 天前 | 显示全部楼层 |阅读模式
字节跳动Seed团队开源了多模态模型BAGEL,该模型具备70亿激活参数(总计140亿参数),支持文本、图像和视频的统一理解和生成。BAGEL在多模态理解榜单上表现优异,超越多个顶级开源模型,并在图像生成质量上与专业生成器媲美。其引入的长思维链COT模式提升了生成内容的质量,同时在图像编辑、风格迁移和世界建模任务中展现出强大能力。此外,BAGEL可通过统一接口实现多轮对话和复杂功能组合,广泛适用于真实及虚拟场景,为多模态技术发展提供了新方向。
来源:https://tech.ifeng.com/c/8jtAUSoCUrD

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-8 19:01 , Processed in 0.284617 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表