阿里巴巴开源深度学习训练框架EPL 可支持10万亿参数超大模型-新利18国际娱乐

阿里巴巴开源深度学习训练框架EPL 可支持10万亿参数超大模型

　　3月4日消息，阿里巴巴宣布完全开源支持10万亿模型的自研分布式深度学习训练框架EPL(Easy Parallel Library，原名whale)，进一步完善深度学习生态。

　　EPL由阿里云机器学习平台PAI团队自主研发，PAI是面向开发者和企业的机器学习/深度学习工程平台，提供包含数据标注、模型构建、模型训练、编译优化、推理部署在内的AI开发全链路服务，内置140多种优化算法，具备丰富的行业场景插件，为用户提供低门槛、高性能的云原生AI工程化能力。

　　EPL是PAI团队一次面向大规模深度学习分布式自动化训练的探索，EPL希望能够简化深度学习模型从单机训练到分布式开发调试的流程。EPL通过对不同并行化策略进行统一抽象、封装，在一套分布式训练框架中支持多种并行策略，并进行显存、计算、通信等全方位优化来提供易用、高效的分布式训练框架。

　　EPL适合不同场景的模型，在阿里巴巴内部已经支持图像、推荐、语音、视频、自然语言、多模态等多样性的业务场景。同时，EPL也支持不同规模的模型，最大完成了10万亿规模的M6模型训练，相比之前发布的大模型GPT-3，M6实现同等参数规模能耗仅为其1%。最新测试结果显示，使用EPL的流水+数据并行对Bert Large模型进行优化，相比于数据并行，训练速度提升了66%。

　　阿里云资深技术专家九丰表示，“近些年，随着深度学习的火爆，模型的参数规模飞速增长，同时为训练框架带来更大挑战。为应对这个问题，我们研发了EPL，EPL功能也随着业务需求的迭代逐渐完善。未来，我们将在软硬件一体优化、全自动策略探索等几个探索性方向上持续投入精力。今天，我们将EPL完全开源，希望和深度学习训练框架的开发者或深度学习从业者之间有更多更好的交流和共建，持续完善深度学习生态。”

科技新闻
机器学习
阿里巴巴
深度学习
框架

您觉得本篇内容如何

评分

声明：本文内容及配图源自互联网收集，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容真实性，不承担此类作品侵权行为的直接责任及连带责任。如涉及作品内容、版权等问题，请联系本网处理，侵权内容将在一周内下架整改。

您需要登录才可以回复登录|注册

提交评论

阿里巴巴开源深度学习训练框架EPL 可支持10万亿参数超大模型

评论

热门资讯

科技快报网

相关阅读

农作物叶片安装传感器可精确检测植物需水时间点

东芝公司开发出功率消耗极低的新型氢气传感器

辅助机器人能够帮助在家中寻找老年人

科学家使用金纳米颗粒阵列研制新型传感器

美国开发出一种可检测汗液的皮肤贴片传感器

我国首条压敏传感芯片生产线落户湖南

美军为伤兵研发智能绷带：能检测伤情还能精准送药

新型发电织物可为可穿戴电子产品持续供电

不需再忍受疼痛！这种纸带传感器或将取代传统糖尿病检测法

新加坡将装倾斜感应器预防老树倾斜断裂

科技快报网

点击进入下一篇