国家大模型标准测试首批通过名单揭晓,阿里通义千问与腾讯混元领衔
12月23日消息,在最近召开的全国信息技术标准化技术委员会人工智能分委会的全体会议上,引起了业界的广泛关注。这次会议特别重要的一环是宣布了国内首个官方“大模型标准符合性评测”的结果。这项评测标志着中国在人工智能领域的一大步前进,腾讯的混元大模型和阿里的通义千问大模型在此次评测中脱颖而出,成为首批通过此项严格评测的四款国产大模型中的两款。 这个“大模型标准符合性评测”由中国电子技术标准化研究院主导,其目的是为了建立一个标准化的名录,从而引导人工智能产业朝着健康有序的方向发展。这个评测过程是相当全面和严格的,它吸引了来自学术界和产业界几十家领先机构的意见。评测覆盖了超过30个维度,涉及语言大模型的通用性和智能性等多方面。 据本站了解,阿里的通义千问大模型在本次评测中表现突出,这是首次有大模型在评测中获得认可。自12月1日开源以来,通义千问 72B已经在多个领域取得显著成就,包括在HuggingFace排行榜和上海人工智能实验室的Open Compass榜单上名列前茅。这一成就标志着它在国际人工智能领域的领先地位。 腾讯方面则介绍说,他们的混元大模型符合了《人工智能大规模与训练模型 第2部分:测评指标与方法》中的相关技术要求。这个大模型具备超千亿的参数规模,预训练语料超过了2万亿tokens,展现了腾讯在大规模数据处理和深度学习领域的强大实力。 除了这两个模型的成就,会议上还有另一重大消息。阿里云和腾讯云分别作为技术牵头方和提案牵头方,共同启动了《人工智能模型即服务(MaaS)功能要求》的讨论和编制工作。这一举措预示着中国在人工智能服务领域的又一大步进展。 截至目前,上述两家公司的大模型是唯一官方宣布通过了这项测试的模型。这一成就不仅代表了他们在技术上的领先,也显示出中国在全球人工智能领域的竞争力。随着这些大模型的不断发展和完善,未来无疑将在人工智能的应用和研究中发挥更加关键的作用。 |