微软和NVIDIA今天宣布了由DeepSpeed和威震天驱动的威震天—图灵自然语言生成模型
语言模型简单来说就是一串单词的概率分布,它的主要功能是为长度为m的文本确定一个概率分布p,表示这个文本存在的可能性。
你可能之前或多或少听过OpenAI最新的语言模型GPT—3,它被称为表面上最强的语言模型,也被视为革命性的人工智能模型除此之外,还有一些重量级产品如BERT,Switch Transformer等,行业内其他企业也在尝试推出自己的车型
微软和NVIDIA今天宣布了由DeepSpeed和威震天驱动的威震天—图灵自然语言生成模型,这是迄今为止训练出来的最大,最强大的解码语言模型。
IT之家了解到,作为图灵NLG 17B和威震天—LM的继承者,这个模型包含了5300亿个参数,MT—NLG的参数数量是GPT—3的3倍,是同类中现存最大的模型,在:等一系列广泛的自然语言任务中表现出无与伦比的准确性。
完整的预测。
阅读理解
常识推理
自然语言推理
词义消歧
基于105层转换器的MT—NLG在零样本,单样本和少样本的设置上改进了最先进的模型,并为两个模型的大规模语言模型设定了新的标准和质量。
根据消息显示,模型训练是在基于NVIDIA DGX superpad的塞勒涅超级计算机上混合精度完成的,该超级计算机由560台DGX A100服务器支持,与HDR InfiniBand以完整的胖树配置连接每台DGX A100都有8个NVIDIA a100 80gb tensorcore GPUs,它们通过NVLink和NVSwitch完全连接在一起微软Azure NDv4云超级计算机采用了类似的参考架构
更多信息请参考微软和NVIDIA官方说明:
微软
显卡
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
热门阅读
- 1长安品牌携手李宁设计再次出圈 树立汽
- 2细微见守护,嘉际白金款演绎健康本色
- 3江苏省连云港市海州区花果山街道前云村
- 4顺丰控股披露了2021年前三季度业绩
- 5李尚郭超归还4.7亿借款的计划失败了
- 6NOH智慧领航辅助驾驶系统技惊全场
- 7长城炮越野皮卡珠峰版 用勇气攀登每座
- 8商用皮卡性价比之王 风骏5干饭版强势
- 9以技术链接未来 走进2021年现代进
- 10悦享越野新生活 哈弗H9-2022款
- 11网通从海外媒体motor1获梅赛德斯
- 12巴马合伙企业的实控人施艳君和任桂龙是
- 13酷派和乐视都回到了国内手机市场司马云
- 14开拓无界征途,哈弗H9-2022款打
- 15朗姿股份披露了前三季度业绩预告国家布
- 16丁敬制药宣布任命StephenPyk
- 17宁波舟山港梅西滚装船码头宁波眉山岛西
- 18一举解决了客户的痛点充分体现了双方以
- 19崛起》是一款由卡普空制作发行的角色扮
- 20中国现成茶的市场规模中国新茶饮店总数
- 21长城炮皮卡学院成立 长城皮卡1-9月
- 22苏博特战略投资的苏州徐阶科技是精选公
- 23中国汽车动力电池产业创新联盟发布20
- 24“塔漠王”董长凯7天横穿塔漠,“最强
- 259月交付8021台 高能坦克持续热销
- 26固特异携手雪铁龙构建自动驾驶城市出行
- 27根据公司新声明在未来新能源汽车业务的
- 28浦东进出境货运航班超过1300架次同
- 29动力煤期货价格高达1400英镑收于日
- 30中国AI平台开发和应用市场的综合竞争
汽车点评网 分析汽车
关注汽车点评网,收听和分享“汽车秘密”
携手汽车点评网,为您提供更多汽车行业新鲜货。