深度:国内4家AI大模型分析,ai模型

描述

ChatGPT这一语言AI模型的火爆出圈,引发了普罗大众对AI应用的热情的同时,也引燃了AI大模型的战火。3月15日,OpenAI发布GPT-4,将这一战火再度升级。

站在底层技术角度来看,从科技巨头到互联网大厂,从创业届到学术届,AI大模型正在成为各方抢滩市场的关键。

目前,国内布局AI大模型厂商百度、阿里、腾讯、商汤、华为等企业,正在不断夯实通用大模型,打造产业模型,助力AI大模型产业化。

百度以文心大模型+飞桨PaddlePaddle深度学习平台;

腾讯以HunYuan大模型+太极机器学习平台;

阿里以通义大模型+M6-OFA;

华为以盘古大模型+ModelArts

都打造了(自然语言处理)大模型 、(计算机视觉)大模型以及多模态大模型方面。

1、百度由于多年在AI领域的深耕,其文心大模型涵盖基础大模型、任务大模型、行业大模型的三级体系,打造大模型总量约40个,产业应用也较为广泛,例如电力、燃气、金融、航天等,构建了国内业界较大的产业大模型。

2、腾讯产业化应用方向则主要是腾讯自身生态的降本增效,其中广告类应用表现出色。

3、阿里更重技术,例如M6大模型基于阿里云、达摩院打造的硬件优势,可将大模型所需算力压缩到极致;另外其底层技术优势还有利于构建AI的统一底层。

4、华为的优势则在于其训练出业界首个2000 亿参数以中文为核心的预训练生成语言模型。目前发布了盘古气象大模型、盘古矿山大模型、盘古OCR大模型三项较为重磅的行业大模型。

本文选自“AIGC专题:国内大模型概览”,分析了达摩院、百度、小米、中科院自动化所等国内部分企业、研究所关于大模型的研究成果、技术方案、落地实践、未来发展规划等方面的内容。

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

审核编辑 :李倩

相关推荐

相关文章