(资料图片)
阿里云今日推出大规模视觉语言模型Qwen-VL,并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发,支持图文输入。相较于此前的VL模型,Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外,还新增了视觉定位、图像中文字理解等能力,可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。(科创板日报)
标签:
阿里云开源通义千问...
祸水东引?亚太国家...
24亿!东珠生态预中...
午评:深成指半日跌...
收购蒙金矿业合理性...
运营商业绩稳步前行...
北向资金净卖额达30亿元
保险险种分类有哪些...
仙佑膏药企业管理优...
河南仙佑:膏药市场...
仙佑医药:新消费趋...
跨期套利是什么意思...
京东家电11.11主场引...
“进”无止境——新...
浩熙玩咖,国内首家...
京东家电11.11“晚8...