华为重大发布:将重塑千行百业!

来源: 21世纪经济报道 2023-07-08 00:23:54 [] [博客] [旧帖] [给我悄悄话] 本文已被阅读: 次 (9083 bytes)

作 者丨倪雨晴 , 毕永豪

编 辑丨骆一帆 , 陈思颖

图 源丨图虫

2023 年,大模型的大竞争时代开启,目前全球已经有数百个大模型亮相,而战场上的主角们还在不断进化。

7 月 7 日,在华为开发者大会 2023(Cloud)上,华为云发布了盘古大模型 3.0 版本。华为常务董事、华为云 CEO 张平安表示,盘古大模型 " 不作诗,只做事 ",将重塑千行百业

事实上,华为对大模型的探索很早就开启,2019 年 ~2020 年,盘古大模型就已在华为云内部立项,并且完成了与合作伙伴、高校的合作搭建。2021 年 4 月,华为云盘古大模型正式对外发布。

从盘古大模型面世之初,就主要面向盘古大模型 3.0 是一个面向行业的大模型系列,包括"5+N+X" 三层架构,分别是基础大模型、行业大模型、专用大模型

2021 年,盘古的多模态大模型、科学计算大模型还在规划中,如今的 3.0 版本,盘古的大模型体系已经颇为丰富。不仅从基础通用大模型发展出行业大模型,还针对细分场景提供更细致的大模型服务。

张平安在会后接受 21 世纪经济报道等媒体采访时表示,对于盘古大模型的下一步计划,内部有非常激进的 roadmap(路线图)。在盘古大模型的发展上,有团队在研究有更多参数让 AI 大模型发展更好,也有团队在研究将参数通过量化,以更少的算力需求来满足服务。另外更重要的是,现在华为云已经在铁路、煤矿、金融等行业里做了模型,在行业的垂直深度还要更深一些。

盘古大模型 3.0 来了

张平安介绍道,最新版本的盘古大模型共有三层架构。其一为基础大模型(L0 层),主要提供通用技能,支撑企业各类应用,具体包括自然语言、视觉、多模态、预测、科学计算五个基础大模型。

在参数方面,盘古 3.0 提供 100 亿参数、380 亿参数、710 参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。

同时,大模型也提供一致的能力集,包括 NLP 大模型的知识问答、文案生成、代码生成以及多模态大模型的图像生成、图像理解等能力,这些技能都可以直接调用。

对于基础大模型的炼成,华为的技术专家在会上指出,盘古大模型的特色是可伸缩、高可扩展的稀疏 - 稠密语言大模型,在数据训练方面,预训练数据超过 3 万亿个 token(AI 大模型的数据单位),指令微调数据的规模在千万级。

基础大模型之外,第二层架构是 N 个行业大模型(L1 层),华为云既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等大模型;也可以基于行业客户的自有数据,在盘古大模型的 L0 和 L1 层上,为客户训练自己的专有大模型。

在此基础上,华为云还提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

华为云人工智能领域首席科学家、国际欧亚科学院院士、IEEE/CAAI Fellow 田奇谈道,通用大模型在落地行业上面临三大挑战,分别是知识虽多、价值挖掘快但数据安全难保障、通用性强但专业性弱。

而盘古大模型通过分层解耦架构从而更好应用到千行百业,从基础大模型迭代出行业大模型。田奇表示,实现行业大模型有四大关键举措,分别是沉淀行业知识、淬炼行业技能、对话专业工具和保障安全合规

行业大模型之上就是 N 个专用大模型(L2 层),提供了更多细化场景的模型。比如,更加专注于政务热线、网点助手、先导药物筛选、传送带异物检测、台风路径预测等具体行业应用或特定业务场景,提供 " 开箱即用 " 的模型服务。

而大模型的发展离不开算力,在大会上,华为云宣布推出昇腾 AI 云服务,并在乌兰察布和贵安同时上线。据悉,昇腾 AI 云服务可以提供更长稳的 AI 算力服务,达到每秒 200 亿亿次浮点运算能力,千卡训练 30 天长稳率达到 90%,断点恢复时长不超过 10 分钟。

张平安表示,华为要构建 AI 算力的另一极," 现在有数百个项目在排队,算力都来不及建设,GPU 价格高、交货周期很长,中国算力紧缺,满足不了需求。华为首先在中国先立足和扎根,满足中国行业客户的需求,立志成为算力的另一极。"

行业大模型深入应用

事实上在 OpenAI 引爆热潮之前,华为等大企业就已经在钻研 AI 大模型,此前几年大模型在学术界早就是热门话题,2023 年才彻底引燃大众市场。

对于华为而言,人工智能自然是必争之地,云、计算都是华为升级转型的重要方向。一方面,华为云盘古大模型并非今年才进入市场,而是已经历经迭代根据业务的需求发展而来,并且已经形成一个系列。

另一方面,需要指出的是,盘古大模型和 ChatGPT 并非在一个赛场,它们属于两个概念。ChatGPT 是 GPT 系列大模型的一个应用场景,可以直接面向 C 用户群体,而盘古大模型的应用场景更多聚焦在 B 端的千行百业,华为本身 B 端起家,在产业端有天然的优势和禀赋。

此前,田奇向 21 世纪经济报道记者表示:"AI 是华为云的核心竞争力之一,我们持续在 AI 领域投入研发,大模型是 AI 的重要技术方向。未来三年,我们认为将会是大模型是风起云涌的三年,AI 将会和各行各业深度结合,AI for industries 将是我们的主要方向。"

目前,盘古大模型已在政务、金融、制造、煤矿、铁路、制药、气象等诸多领域进行深耕。比如在政务领域,华为云携手深圳市福田区政务服务数据管理局,上线了基于盘古政务大模型的福田政务智慧助手。在煤矿领域,盘古矿山大模型已经在全国 8 个矿井规模使用,一个大模型可以覆盖 1000 多个细分业务场景。

在制造领域,过去单产线制定器件分配计划,往往要花费 3 个小时以上才能做齐 1 天的生产计划。盘古制造大模型学习了华为产线上各种器件数据、业务流程及规则以后,能够对业务需求进行准确的意图理解,并调用天筹 AI 求解器插件,1 分钟即可做出未来 3 天的生产计划。

在气象领域,盘古气象大模型是首个精度超过传统数值预报方法的 AI 预测模型,同时预测速度也有大幅提升。原来预测一个台风未来 10 天的路径,需要在 3000 台服务器的高性能计算机集群上花费 5 小时进行仿真。现在基于预训练的盘古气象大模型,通过 AI 推理的方式,研究者只需单台服务器上单卡配置,10 秒内就可以获得更精确的预测结果。

7 月 6 日,国际顶级学术期刊《自然》 ( Nature ) 杂志正刊发表了华为云盘古大模型研发团队研究成果——《三维神经网络用于精准中期全球天气预报》(《Accurate medium-range global weather forecasting with 3D neural networks》)。数据显示,这是近年来中国科技公司首篇作为唯一署名单位发表的《自然》正刊论文。

眼下,国内外的巨头们都已经在大模型赛场上落子,随着 AI 产业 "iPhone 时刻 " 的到来,AI 如何融合产业进行升级变革、如何进行商用也将备受关注,产业界也更加期待中小开发者们也像雨后春笋一样涌现,构建起更完善的 AI 生态。

大模型成为 WAIC 最火关键词

7 月 6 日至 8 日,2023 世界人工智能大会(WAIC)在上海举办。本届大会聚焦科学前沿和产业发展,首次设置 " 迈向通用人工智能 " 主题展区,集中展示国内外总计 30 多款大模型,大模型成为今年 WAIC 的最火关键词。

请您先登陆,再发跟帖!