阿里云开源通义千问多模态大模型Qwen-VL

来源:财华社 ┆ 时间:2023-08-25 14:06:00

(资料图片)

阿里云今日推出大规模视觉语言模型Qwen-VL，并对其直接开源。Qwen-VL以通义千问70亿参数模型Qwen-7B为基座语言模型研发，支持图文输入。相较于此前的VL模型，Qwen-VL除了具备基本的图文识别、描述、问答及对话能力之外，还新增了视觉定位、图像中文字理解等能力，可用于知识问答、图像标题生成、图像问答、文档问答、细粒度视觉定位等场景。（科创板日报）

标签：

上一篇：消息称奈雪CTO何刚离职，或参与大模型创业

下一篇：最后一页

阿里云开源通义千问多模态大模型Qwen-VL

相关阅读

精彩图片

最新资讯

热点推荐

栏目排行

栏目推荐