阿里云推大规模视觉语言模型开源,支持中英文多种语言
2023-08-28 12:59:31 来源:中关村在线
【资料图】
阿里云于8月25日推出了大规模视觉语言模型Qwen-VL,该模型已在ModeScope开源。此前,阿里云已经开源了通用模型Qwen-7B和对话模型Qwen-7B-Chat。Qwen-VL是一款支持中英文等多种语言的视觉语言模型,相较于此前的视觉语言模型,除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力。Qwen-VL以Qwen-7B为基座语言模型,在模型架构上引入视觉编码器,使得模型支持视觉信号输入,该模型支持的图像输入分辨率为448,此前开源的视觉语言模型通常仅支持224分辨率。官方表示,该模型可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景,在主流的多模态任务评测和多模态聊天能力评测中,取得了远超同等规模通用模型的表现。在Qwen-VL的基础上,通义千问团队使用对齐机制,打造了基于语言模型的视觉AI助手Qwen-VL-Chat,可让开发者快速搭建具备多模态能力的对话应用。通义千问团队同时表示,为了测试模型的多模态对话能力,他们构建了一套基于GPT-4打分机制的测试集“试金石”,对Qwen-VL-Chat及其他模型进行对比测试,Qwen-VL-Chat在中英文的对齐评测中均取得了开源视觉语言模型最好结果。
关键词:
[责任编辑:xwzkw]
相关阅读
- (2023-08-28)阿里云推大规模视觉语言模型开源,支持中英文多种语言
- (2023-08-28)中科软:上半年实现净利润2.09亿元 同比增长28.7%
- (2023-08-28)川宁生物:预计下半年抗生素市场需求将维持旺盛状态
- (2023-08-28)曝《战神:诸神黄昏》有望推出可下载DLC:已开发60%
- (2023-08-28)东微半导(688261):短期下游客户需求调整、行业竞争加剧 看好公司长期技术差异化
- (2023-08-28)扬子新材2023年上半年净利-1303.93万 亏损减少21.7%
- (2023-08-28)民慧股份全资子公司慧远定制拟向银行申请不超过1000万综合 公司提供连带责任保证担保
- (2023-08-28)移动咸阳分公司加强协同持续推进电信网络诈骗治理
- (2023-08-28)前海人寿持续开展第八届客服节系列活动
- (2023-08-28)再过8周,四大生肖瑞气盈门,鸿运连连,风调雨顺
- (2023-08-28)广电计量2023年上半年净利6016.13万 同比增加215.57%
- (2023-08-28)教育部部署做好秋季开学安全准备工作
- (2023-08-28)研学团涌入高校背后:免预约?会议室办活动?
- (2023-08-28)吕梁社保个人缴费最低标准 2023~2024年吕梁社保个人和公司缴费金额是多少
- (2023-08-28)证监会:破发、破净或三年未分红,实控人不得减持股份
- (2023-08-28)日本福岛当地最大港口爆发抗议集会
- (2023-08-28)第八届“避暑山庄杯”国际冰球邀请赛鸣金
- (2023-08-28)高考补录志愿填报(高考补录怎么填志愿)
- (2023-08-28)特朗普:自首拍嫌犯大头照感觉“不舒服” 拜登:是个帅哥
- (2023-08-28)重庆大学城市科技学院宿舍套间(重庆大学城市科技学院宿舍)
- (2023-08-28)李延年简介
- (2023-08-28)被骗了一千九,他反过来要告我
- (2023-08-28)不再限制购房套数 浙江嘉兴发布21条新政
- (2023-08-28)日本排放核污水,需要囤盐吗?多地提醒
- (2023-08-28)3连胜领跑皇马别乐观!依赖贝林厄姆不买中锋,新赛季将四大皆空
- (2023-08-28)峡江:计量检查进企业
- (2023-08-28)蓝山开展“酷暑送关怀 清凉满心间”走访活动
- (2023-08-28)《光明日报》上的田汉足迹
- (2023-08-28)厦门调整城镇土地基准地价 租赁住宅价格约为商品住宅的20%至25%
- (2023-08-28)李在明:二战时日本用刀枪制造破坏,现在似乎正用辐射威胁全球