通义千问再开源超百亿级参数规模大模型-新利18国际娱乐

通义千问再开源超百亿级参数规模大模型

经济观察网记者钱玉娟

9月25日下午，阿里云宣布开源通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat，供全社会免费商用。阿里云透露，70亿参数的Qwen-7B等模型开源至今，短短一个半月时间里，下载量已突破百万量级。如今，用户既可以从中国大模型开源社区魔搭社区内直接下载14B模型，也可以通过阿里云的灵积平台访问和调用模型。

据了解，阿里云的灵积平台上，除了自研的通义千问大模型外，还托管着百川、姜子牙、Stable Diffusion、ChatGLM-v2等行业大模型。

“我们是一个开源的模型社区，希望给不同的开发者、企业更多的选择。”阿里云CTO周靖人接受经济观察网记者采访时称。周靖人说，“今天只做一个非常foundation（基础）的model（模型），跟我们实际的应用场景会有很多的距离。”他希望团队更为重要的一件事是：帮助开发者和企业用好模型。

基于此，通义千问选择对自研大模型开源，目的是为开发者、企业后续使用提供一个选项，周靖人表示，“不同场景根据自身需求，选择不一样规模的模型来应用于自己的开发环境里。”

伴随模型参数以及整体容量和能力的增加和提升，14B模型会比7B模型在某些长尾领域表现出更强的认知能力、推理能力等，周靖人指出“14B模型在模型微调和模型应用方面会更具性价比。”

不只是阿里云走上了大模型开源之路，全球以及中国市场上很多厂商都在做出这一选择，IDC中国高级分析师程荫称，“模型开源会让更多的人接触到大模型技术，从而降低技术学习和使用的门槛和成本，促进大模型在行业内的广泛应用。”

行业开源开放确实是趋势，但“让AI更普惠”这句话在周靖人看来，实现起来并不容易。

“只做开源也不行，不做开源更不行。”周靖人强调，当下大模型生态需要在技术创新的同时也要更及时地触达中小企业和个人开发者。

“未来可能会形成一种开源模型和商业模型并存的格局。”程荫分析，开源模型会促进更多生态的形成，降低训练模型的巨大成本，为创业型企业、开发者们带来更多机会。

您觉得本篇内容如何

评分

声明：转载此文是出于传递更多信息之目的。若有来源标注错误或侵犯了您的合法权益，请与我们联系，我们将及时更正、删除，谢谢。

您需要登录才可以回复登录|注册

提交评论

通义千问再开源超百亿级参数规模大模型

评论

热门资讯

经济观察网

相关阅读

毛德操老师《RISC-V CPU芯片设计：香山源代码剖析》新书发布会在北京举办

阿里等商业巨头借传感器技术深度参与垃圾分类产业链

2019中国互联网企业百强榜单发布，Top3是阿里腾讯百度（附名单）

阿里巴巴：让ET“医疗大脑”成长为“高级医师”

阿里推出AI芯片“含光800”：1颗含光800的算力相当于10颗GPU

疫情之下催生各类人工智能，如何打造终极护城河

2019年全球智能音箱销售再创新高，百度、小米、阿里销量翻番

阿里达摩院最新成立XG实验室致力于5G技术研发

城市互联网为智慧生活提速

阿里投资5000万打造物流物联网开放平台

相关知识

经济观察网

点击进入下一篇

通义千问再开源超百亿级参数规模大模型

评论

热门资讯

经济观察网

相关阅读

毛德操老师《RISC-V CPU芯片设计：香山源代码剖析》 新书发布会在北京举办

阿里等商业巨头借传感器技术深度参与垃圾分类产业链

2019中国互联网企业百强榜单发布，Top3是阿里腾讯百度（附名单）

阿里巴巴：让ET“医疗大脑”成长为“高级医师”

阿里推出AI芯片“含光800”：1颗含光800的算力相当于10颗GPU

疫情之下催生各类人工智能，如何打造终极护城河

2019年全球智能音箱销售再创新高，百度、小米、阿里销量翻番

阿里达摩院最新成立XG实验室 致力于5G技术研发

城市互联网为智慧生活提速

阿里投资5000万打造物流物联网开放平台

相关知识

经济观察网

点击进入下一篇

毛德操老师《RISC-V CPU芯片设计：香山源代码剖析》新书发布会在北京举办

阿里达摩院最新成立XG实验室致力于5G技术研发