技能大模式Skill Model重磅发布 浪潮"源"大模型加速AI生产力升级

2022-07-01
关注
摘要 "源1.0"是浪潮信息在2021年发布的巨量中文语言模型,参数量高达2457亿,比此前OpenAI发布的GPT-3大模型,参数量增加40%,训练数据集提升10倍。

资讯频道文章B

  近日,浪潮信息发布了基于"源1.0"大模型生成的4个技能大模型(SkillModel),分别为对话模型"源晓问"、问答模型"源晓搜"、翻译模型"源晓译"、古文模型"源晓文"。这些技能大模型在各自细分领域的精度业界领先,可直接应用于人机交互、知识检索、语言翻译和文学创作等领域,模型运行速度最高提升9倍。更重要的是,基于大模型快速生成特定领域的技能大模型(SkillModel),也意味着"源"的AI生产力大幅升级,能够帮助商业组织和研究机构实现对AI技术的高效、快速和低成本应用,加速产业AI化。

  技能大模型(SkillModel):大模型生产方式的新变革

  应用场景的碎片化导致大量的定制化,是当前人工智能从技术向应用转化过程中,遇到的一个突出问题。千行百业使用人工智能,如果一个场景一个场景的去定制,无论是时间成本还是人力成本都很高,维护的难度也很大。大模型的出现,使得模型的生产效率得到了极大的提高,技能模型就是典型的代表。

  所谓技能大模型(SkillModel),是指面向特定行业或场景,通过知识蒸馏、模型裁剪、模型压缩等技术,通过通用大模型生成具备该行业或场景所需特定技能的专业模型,在保留通用大模型的知识、认知推理能力及泛化能力基础上,实现针对该领域的技能专业化、模型轻载化和调用标准化。

  "技能大模型(SkillModel)"带来了AI模型生产方式的新变革,将原本耗时数月经年的大模型开发训练周期,缩短至短短数周,极大降低了开发与训练成本。技能大模型(SkillModel)的价值在于,其针对特定领域进行了强化学习,能够实现与通用的基础大模型相当或更好的性能表现,且拿来即用,使用门槛更低,应用效果更佳。同时由于模型的轻载化特点,使其便于部署且消耗计算资源更少,能够显著减低使用成本和维护难度。

  此外,技能大模型(SkillModel)还可以与通用大模型协同进化,它的执行结果反馈给通用大模型后,能够让通用大模型的知识与能力持续进化,即落地场景越多、模型进化得"越聪明",同时模型进化的速度也越快。

  浪潮信息副总裁刘军表示:"研发大模型需要千万元的训练成本,海量数据集及巨大的算力资源,这对很多客户来说是个巨大的门槛,我们希望通过"技能大模型(SkillModel)"的模型生产方式变革,推动AI生产力的升级,让行业用户甚至是中小用户也能利用大模型开展深度创新,从而加速整个社会的智能化升级。"

  四大技能模型重磅发布:对话、问答、翻译、古文

  此次浪潮信息发布的四大技能模型(SkillModel),在继承"源1.0"大模型通用的知识与能力基础上,面向特定领域的场景进行针对性的技能优化,模型精度和训练效率均处于业界领先:在十分之一参数量的情况下,即可在相同任务上复现98%的通用大模型效果,推理速度最高提升9倍。

  对话模型("源晓问")在源大模型基础上,又采用了2660万条医疗、法律、保险等不同行业,历史、电影、娱乐等不同场景的对话语料数据进行强化训练,在高频闲聊、知识问答等开放式问答对话上表现突出,打榜业界权威测评WebQA开放问答数据集及CUGE两项榜单均位居榜首。作为高水平对话问答技能模型,源晓问可广泛应用于虚拟人、智能助手、智能客服等场景。目前已经有开发者在GitHub社区发布了由源1.0进行角色扮演的剧本杀实录,源1.0的场景化对话技能已经达到了"人机难辨"的程度。

  翻译模型("源晓译")基于源大模型阅读的海量高质量数据集,采用维基百科、书籍、联合国文件及字幕组等近80G高质量数据集进行强化训练,因此翻译不但流畅准确,同时更符合中文表述,在中译英时表述更加专业地道,可轻松应对日常对话、新闻、哲学、小说等日常的语言翻译任务。翻译模型打榜业内权威WMT数据集及CUGE两项榜单均位居榜首。

  问答模型("源晓搜")链接了包含了维基百科、书籍等知识的数据库,根据用户提问的内容,利用高性能检索方法,快速地从知识数据库中检索到与提问内容相关的内容作为背景知识,在相关专业知识背景下回答问题,能够生成符合人类语言习惯的专业答复。问答模型支持不同领域知识检索,仅通过替换链接的知识库便可实现在不同专业领域之间的适配,实现了搜索和生成的一体化框架,能满足不同领域知识检索的需求,可广泛应用于医疗、法律、保险及娱乐等领域的智能客服、个人助理等场景。此前在打榜WebQA任务上,问答模型以55.97%的准确度在业界遥遥领先。

  古文模型("源晓文")在源大模型精读了5000GB高质量中文的基础上,又学习了先秦到近代几乎所有诗词,并精选其中最优秀的10万首进行强化训练。海量学习兼针对性强化训练使得古文理解模型能够精通古诗词的用词、文法及平仄格律等规则,还擅长营造意境、引经据典,同时兼具古文解析的能力,因此古文模型能够轻松解决今年高考古文翻译、诗词鉴赏等题目,在"金陵诗会"活动中,短短3天作诗近2000首,可广泛应用于文学创作、古诗文教学、汉语言文化研究等场景中。

  "源1.0"是浪潮信息在2021年发布的巨量中文语言模型,参数量高达2457亿,比此前OpenAI发布的GPT-3大模型,参数量增加40%,训练数据集提升10倍,发布时便问鼎中文语言理解评测基准CLUE榜单的零样本和小样本学习两类总榜冠军。目前,"源1.0"已经相继完成了模型API、高质量数据集、模型训练代码、推理代码和应用代码等等内容的开源开放,在GitHub社区、浪潮源官网均可以申请获取相关的资源,已有超600家用户借助"源1.0"提供的数据集和API,构建了覆盖金融、互联网、医疗和自动驾驶等行业的高水平人工智能应用。


您觉得本篇内容如何
评分

相关产品

CSMS 中科微感 人工智能+嗅觉传感器(AI-Nose) 气体传感器

中科微感逐步攻克了制约人工嗅觉传感发展的核心材料、硬件、算法等技术,开发出了以新型纳米敏感材料为基础,以微纳加工技术为支撑,以人工智能算法为核心的第一代 MEMS 基金属氧化物半导体原理的人工嗅觉传感器产这一产品将解决当前制约人工智能嗅觉技术与市场应用发展的关键问题:提供量产化的高一致、低成本、微型化的嗅觉传感器阵列硬件,以及提供标准化的人工智能+嗅觉气味感知软件平台,使客户能够快速构建和应用气味数据模型

XKCON 祥控 弹药库环境温湿度异常报警与智能监控系统 温湿度变送器

济南祥控自动化设备有限公司自主研发的XKCON祥控弹药库环境温湿度异常报警与智能监控系统采用物联网、传感器、大数据、人工智能等先进技术,能够对弹药库环境温湿度信息实现数字化、可视化管理。

山东美安 矿山电机车防追尾道岔口报警器 控制器及系统

煤矿用机车防追尾保护装置 机车防追尾保护装置是一种矿用人工智能保护装置、具有防追尾保护、无线触发沿途弯道语言保护、输出控制并记录等功能可广泛的使用在矿山井下、井上的运输机车上。

KEYENCE 基恩士 AI-1000C 图像匹配传感器

因此,人工智能系列能够在模式匹配的基础上对物体进行稳定的检测和识别,而这是基于强度或距离的传感器难以实现的。 基于强度或距离的传感器难以实现。

云传物联 水质生态浮标浮台在线测系统 多参数监测系统

电子水质监测解决方案利用信息控制与处理、人工智能、自动化、物联网及多媒体等技术,集水质参数在线采集、无线传输、智能处理、超限报警、远程管理等功能于一体的水质监测解决方案。

DINSEE 鼎信智慧科技 DX-WPS100-SP2... CMOS图像传感器

针对传统配电线路人工巡检效率低、周期长等问题,鼎信智慧结合物联网、红外热成像、人工智能等技术,研发了配电线路图像视频双光球机在线监测装置。

大立科技 DM60-W3 红外体温快速筛检

红外热成像体温快速筛检系统DM60-W3系列为384*288/640*480像素,人工智能算法,远距离、大场景测温更精准。

Maike 迈科光电 MK-PB4023PS&ALS&VC-A01E 接近传感器

EM30918、STK3311-X、STK3321、APDS-9900 ,9901、TMD2772WA、RPR0521RS、VCNL4035X01 WH4530A),广泛应用于平板电脑、工控显示类产品、智能家居、AI人工智能等场景,联想笔记本电脑,九安医疗的测温仪,微步数码的平板等都应用了我们这颗传感器,已量产批量出货。

Handsome 翰德圣 HDSELM V1.1 安全传感器和系统

设备全生命周期管理平台融合的物联网、云计算、大数据、人工智能、优化制造、再制造六项主流技术,通过云端模块化的架构可为企业灵活管理设备,不仅可以随时随地了解设备运行状态、发现故障隐患,还能够通过大数据分析指导企业维修

评论

您需要登录才可以回复|注册

提交评论

提取码
复制提取码
点击跳转至百度网盘