阿里推出多模态模型Qwen VLo，支持精准P图、开放指令修改及多语言交互

周大发表于 2025-6-28 15:46:23

阿里巴巴发布新一代多模态模型Qwen VLo，具备更强的理解与图像再创造能力。该模型支持自然语言指令编辑图片，可完成风格迁移、背景替换、多任务修改等操作，并兼容中英文等多语言输入。其创新的渐进式生成机制提升了图像质量和可控性，还可实现文本到图像生成、边缘检测、动态长宽比图像处理等功能。目前处于预览阶段，部分功能尚在优化中，未来有望拓展图像交互与内容理解的新应用场景。
来源：https://tech.ifeng.com/c/8kXtrRVjdkT

		自动登录	找回密码
密码			立即注册

课程导航

阿里推出多模态模型Qwen VLo，支持精准P图、开放指令修改及多语言交互