腾讯吐露最新大模子磨炼措施,可节约50%算力老本

焦点 2024-10-26 14:33:32 1

21世纪经济报道记者白杨 北京报道

随着大模子时期到来,腾讯吐露模子参数呈指数级削减,最新已经抵达万亿级别 。大模与此同时,磨炼大模子也逐渐从反对于繁多模态、措施繁多使命睁开为反对于多种模态下的可节多种使命 。

在这种趋向下  ,约算大模子磨炼所需算力重大 ,力老远超单个芯片的腾讯吐露处置速率,而多卡扩散式磨炼通讯斲丧重大。最新若何后退硬件资源运用率 ,大模成为影响国产大模子技术睁开以及适用性的磨炼紧张条件。

在此布景下,措施腾讯于11月23日宣告,可节腾讯混元大模子眼前的约算自研机械学习框架Angel再次降级,可将大模子磨炼功能提升至主流开源框架的2.6倍,千亿级大模子磨炼可节约50%算力老本 。

Angel能耐提升眼前 ,是基于磨炼框架以及推理框架的迭代。据悉,面向大模子磨炼  ,腾讯自研了机械学习磨炼框架AngelPTM,可针对于预磨炼 、模子精调以及强化学习等全流程妨碍减速以及优化,可能以更少的资源以及更快的速率磨炼更大的模子 。

而为了处置推理老本的不断回升,腾讯自研的大模子推理框架AngelHCF经由扩展并行能耐、接管多种Attention优化策略等方式对于功能妨碍了提升 。同时,框架还适配了多种缩短算法,之后退吞吐能耐  ,从而实现更快的推理功能以及更低的老本 。

实测数据展现,相较于业界主流框架 ,AngelHCF的推理速率后退了1.3倍 。在腾讯混元大模子文生图的运用中,推理耗时从原有的10秒延迟至3-4秒。

此外,降级后的Angel还提供了从模子研发到运用落地的一站式平台,搜罗数据处置  、精调  、模子评估、一键部署以及揭示词调下等效率,让大模子的“开箱即用”成为可能 。

据介绍,在运用开拓层面 ,腾讯外部已经有逾越300项营业以及运用途景接入腾讯混元大模子内测,比照上个月数目翻了一倍。

(作者 :白杨 编纂:骆一帆)

本文地址:https://kbihpjz.strain.blog/news/244d599748.html
版权声明

本文仅代表作者观点,不代表本站立场。
本文系作者授权发表,未经许可,不得转载。

全站热门

原创 交易解禁!湖人列出五大人选,老鹰两将完美补强?拉文性价比最差

火箭军士官学校教授顾爱云:铸魂育人,“播火”东风方阵

原创 锡伯杜有眼无珠?法国核心热身赛轻松砍13+5+4,在尼克斯却被弃用

B费:曼彻斯特缺少葡式餐厅,我在考虑和队友合开一家猫妈被救助后,生下3种颜色的猫,全家撞脸迪士尼角色,好梦幻!

威海481家企业加速向海“掘金”9岁女孩放学路上失踪,10年后在邻居家发现,父母哭到崩溃

“猛龙”过江,“远航”启航,2023成都车展好不热闹王宝强的女儿终于长大,这长相是谁的孩子,一眼就看出来了

推拿腹部能防病治病?有哪些摄天生效与短处?

19万级美式大7座SUV,2023雪佛兰开拓者呼伦贝尔试驾

友情链接