阿里推出多模态模型Qwen VLo,支持精准P图、开放指令修改及多语言交互

[复制链接]
周大 发表于 前天 15:46 | 显示全部楼层 |阅读模式
阿里巴巴发布新一代多模态模型Qwen VLo,具备更强的理解与图像再创造能力。该模型支持自然语言指令编辑图片,可完成风格迁移、背景替换、多任务修改等操作,并兼容中英文等多语言输入。其创新的渐进式生成机制提升了图像质量和可控性,还可实现文本到图像生成、边缘检测、动态长宽比图像处理等功能。目前处于预览阶段,部分功能尚在优化中,未来有望拓展图像交互与内容理解的新应用场景。
来源:https://tech.ifeng.com/c/8kXtrRVjdkT

Archiver|手机版|靠浦网络|靠浦ai课堂 ( 鄂ICP备17024134号-3 )

GMT+8, 2025-6-30 11:56 , Processed in 0.289773 second(s), 23 queries .

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表