阿里云通义千问通过国家大模型标准符合性评测
2023-12-23 10:13
12月22日消息,国内首个官方“大模型标准符合性评测”结果公布,阿里云通义千问大模型成为首批通过评测的四款国产大模型之一,在通用性、智能性等维度均达到国家相关标准要求。本次通过评测的首批大模型中,通义千问是唯一的开源模型。
图源:阿里云官方
据介绍,“大模型标准符合性评测”由中国电子技术标准化研究院发起,旨在建立中国大模型标准符合性名录,引领人工智能产业健康有序发展。该评测对外征集了学术界、产业界几十家头部单位意见,覆盖评估语言大模型通用性、智能性的38项具体评测维度,是基于官方大模型测试基准的权威评测。
阿里云通义千问在全球拥有广泛的开发者用户和企业客户,其性能表现及安全性得到了大范围的公开检验。12月1日开源后,通义千问72B在10个权威基准评测中创下开源模型最优成绩,并力压Llama2登顶海外最具权威性的HuggingFace排行榜,此后又登上国内上海人工智能实验室OpenCompass榜首。
目前,通义千问APP可在苹果和安卓各大应用商店中下载,提供文本对话、语音对话、文学分析、外语及文言文翻译、PPT大纲助手、小红书文案等几十项实用功能。
通义千问720亿参数模型开源 图源:阿里云官微
阿里云是国内最早开源自研大模型的科技企业,8月以来开源了Qwen-7B、Qwen-14B和视觉理解模型Qwen-VL。本月初,阿里云还举办了通义千问发布会,开源通义千问720亿参数模型Qwen-72B。此外,通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio。
截至目前,通义千问共开源18亿、70亿、140亿、720亿参数的4款大语言模型,以及视觉理解、音频理解两款多模态大模型,实现“全尺寸、全模态”开源。
值得一提的是,在今年4月举办的阿里云峰会上,原阿里巴巴集团董事会主席兼首席执行官、原阿里云智能集团首席执行官张勇表示,阿里所有产品未来将接入通义千问大模型全面升级。而11月份的分析师电话会上,阿里巴巴集团新任CEO吴泳铭在首次全面阐释阿里巴巴新发展阶段的战略大图时,也强调了AI对集团的重要性。