AI 助理
备案 控制台
开发者社区 机器之心 文章 正文

以落地考验价值,大模型的产业大考来了

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP自然语言处理_基础版,每接口每天50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 在今日举行的百度 WAVE SUMMIT+2022 深度学习开发者峰会上,百度产业级深度学习开源开放平台飞桨以及产业级知识增强大模型文心均迎来了重大升级,其中大模型的产业化路径和文心行业大模型的实践成为峰会的焦点。

从 BERT 和 GPT-3 发展至今,大模型已然成为当前 AI 发展的重要方向。大模型增强了 AI 的通用性,构筑了 AI 技术和应用的坚实基座。在这股不可阻挡的大模型发展潮流中,各家大厂纷纷投入大量资金、人才和配套服务,从数据、算法和算力多方面推进大模型的研制、训练和建设。


行业的投入使大模型迎来显著进展,千亿甚至万亿参数的大模型陆续出现,覆盖了 NLP、CV 和跨模态等领域。然而,只有落地才能实现大模型的价值。各家不断探索大模型落地的新方法、新模式,作为国内 AI 领域的领头羊,百度持续发力自身文心大模型体系,形成产业级和知识增强两大核心特性。


今年 5 月,百度提出了要构建更适配应用场景的模型体系,最亮眼的发布就是业界首发两个行业大模型 —— 国网 - 百度 · 文心和浦发 - 百度 · 文心。此后行业大模型成为文心着力的重点,7 月推出世界首个航天领域大模型 ——航天 - 百度 · 文心。近日又相继推出传媒行业大模型——人民网 - 百度 · 文心、影视行业智感超清大模型——电影频道 - 百度 · 文心、智慧城市领域大模型——冰城 - 百度 · 文心。


百度并没有止步于此,而是致力于将大模型应用拓展到更广泛的行业领域。在 11 月 30 日举行的 WAVE SUMMIT+ 2022 深度学习开发者峰会上,百度文心产业级知识增强大模型全景图迎来升级,在全新发布的 11 个大模型中,包括 5 个行业大模型,分别是泰康 - 百度 · 文心、深燃 - 百度 · 文心、吉利 - 百度 · 文心、TCL - 百度 · 文心以及辞海 - 百度 · 文心

image.png

在仅仅半年的时间里,百度文心行业大模型的数量已经达到了 11 个,覆盖能源电力、金融、航天、传媒、影视、汽车、城市管理、燃气、保险、电子制造和社科等多个领域,进一步丰富了行业大模型的应用场景,在产业化落地的过程中使大模型真正赋能千行百业。


更多行业大模型的发布彰显出百度文心大模型践行自身产业级特性的决心,无论是从如今行业大模型的数量还是覆盖行业范围而言,百度显然已经初步形成自身大模型产业化落地的行业布局。


在峰会上,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰博士表示,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。


契合场景需求、加速 AI 落地,文心行业大模型不断壮大


大模型的发展从来不是一蹴而就的,从数据采集到模型开发、训练、推理部署再到最后的落地,关关难过但又必须过。在实现落地的最后一环上,研发契合场景需求的行业大模型成为业界采取的主要发展模式,而正是百度开启了先河。


文心行业大模型植根于文心大模型,在 NLP、CV 和跨模态等基础通用大模型掌握通识知识的基础上,对行业知识、数据、经验和任务进行更深入的了解,达到在特定行业、特定应用场景中的性能最优。文心行业大模型的打造,就是要解决大模型与应用场景之间的鸿沟。


百度通过联合头部企业和机构,秉持「从产业中来,到产业中去」,不断将大模型技术融入到更多行业和应用场景中。在这一过程中,文心行业大模型逐渐形成自己的核心特色 ——行业知识增强


一方面,基于通用的文心大模型挖掘特定行业应用场景中大量存在的行业特色数据和知识,进行大规模无监督的联合训练;另一方面,与行业专家一起探讨,引入行业实际业务积累的样本数据和特有知识,并在训练中结合业务经验,设计行业领域特色算法,使最终训出的行业大模型适配性更强,切实解决真实场景问题。


特定行业数据、知识以及经验的加入,使得通用文心大模型真正做到了与行业的融会贯通,其能力的发挥也更加地有的放矢。

image.png

对于合作企业、机构而言,加入行业特色数据与知识、精准匹配真实应用场景的行业大模型能够极大提升业务流程效率和水平。


以百度联合吉利发布的知识增强的汽车行业大模型 ——吉利 - 百度 · 文心为例,它基于文心 NLP 大模型 ERNIE 3.0,结合了吉利汽车专业领域行业数据(汽车领域媒体知识、客服工单、法律法规以及汽车售后维修手册)进行预训练,充分理解掌握汽车行业知识,得到性能更强、稳定性更高的汽车领域大模型。

目前,吉利 - 百度 · 文心已经应用于吉利的智能客服系统、车载语音系统和汽车领域知识库构建等业务场景中,实现显著的业务效率提升。随着将大模型等 AI 前沿技术应用于更多汽车业务中,双方还将以吉利 - 百度 · 文心大模型为通用底座,进一步支撑吉利在智能车机、知识资产管理和用户运营与智能营销等场景实现智能化升级。


image.png同样,其他四个新发布的行业大模型在对应的行业应用场景中也实现了任务效果的显著提升。但影响远不止此,文心大模型具备强泛化能力,因此除了适配已展示任务之外,将来可能针对更多相关领域任务进行训练微调,从而加速大模型在整个行业的落地,发挥更大的行业价值。


从开启先河到体系初成,文心行业大模型内外两手抓


随着业界越来越认可行业大模型的发展模式,趋同在所难免,因此发展自己的核心竞争力尤为重要。


在百度看来,行业大模型是结合行业落地过程中非常重要且有效的方式,今年以来陆续发布的 11 个行业大模型即是最好的例证。对于行业来说,它们得到 AI 技术力量的加持;对于文心大模型的建设来说,行业的反哺使得整个体系更强,基础通用大模型能力也得到提升。


至于百度文心行业大模型如何保持优势?我们可以从「内秀」和「外拓」这两个建设思路具体分析。


所谓「内秀」,即百度自身技术能力的持续积累。一方面,百度有自研的深度学习平台 ——百度飞桨,包括其上开发、训练、推理部署的能力、高效的工具与组件、广泛的硬件适配和生态等,所有这些为包括行业大模型在内的文心大模型提供支撑;另一方面,行业大模型自身也具有强沉淀性,它建模了大量的行业数据和知识,在整个应用过程中,又由应用反馈带来持续训练和进化,能力愈来愈强。


所谓「外拓」,即百度联合各行各业的头部企业、机构,不断寻找与产业场景需求高度契合的领域,拓展行业大模型可能产生助益的范围,在与合作伙伴的深入技术交流和合作中充分释放大模型的价值。


飞桨平台支撑文心大模型,加速产业智能化升级


在模型层,除了行业大模型之外,此次升级的百度文心大模型全景图中还新增了 5 个基础大模型,它们分别是知识增强轻量级大模型 ERNIE 3.0 Tiny、跨模态理解大模型 ERNIE ViL 2.0、跨模态生成大模型 ERNIE ViLG 2.0、文档智能大模型 ERNIE-Layout 和单序列蛋白质结构预测大模型 HelixFold-Single;1 个任务大模型,即代码大模型 ERNIE-Code。


全面释放大模型的效能、让开发者方便快捷地使用文心大模型,配套的开发套件、平台和 API 必不可少。因此,此次文心大模型在工具与平台层也进行了一系列更新,让大模型与使用者之间连接的更紧。


  • 开发套件全面升级,提供开箱即用的场景化建模工具,首发产业级行业大模型定制工具,提供更为丰富的模型精调工具,以及大模型可信学习工具;
  • 文心 API 服务支持多种模型尺寸的精调,体验专区提供更多可体验能力,同时基于大规模集群算力分布式推理加速能力,可满足大规模高性能产业级调用;
  • 飞桨企业版 EasyDL 零门槛 AI 开发平台和 BML 全功能 AI 开发平台,升级提供全流程开箱即用的大模型能力。EasyDL 零门槛 AI 开发平台预置了各种通用任务场景的大模型,使 AI 应用开发者获得更好的模型训练效果;BML 全功能 AI 开发平台实现大模型训练加速、场景建模、应用集成,让大模型的落地像流水线一样高效。


此前,为了充分开拓大模型的创意与探索空间,百度推出了基于文心大模型的创意社区 ——旸谷大模型创意与探索社区,将智能化能力带到各行各业以及所有人的面前。此次文心大模型在产品与社区层又收录了 2 个大模型应用产品,分别是文心一格和文心百中


文心一格是基于文心大模型的业界首个 AI 艺术和创意辅助平台,于今年 8 月推出。用户使用自然语言输入创想,即可完成别具一格的画作。文心一格在创作风格上多变,支持插画、科幻、动漫风以及中国风骨的画作。现在文心一格的能力又得到了更多升级,支持以图生图、支持可控的增删改等图片二次编辑、一键生成视频,进一步激发了用户的创造力,降低内容生产成本。


文心百中是百度搜索与文心大模型联合研制的基于大模型的产业级搜索系统,寓意为搜得准确,百发百中,具有极简、强大以及高效三大特性。首先与传统级联式的搜索系统不同,文心百中以文心大模型为支撑,在系统和应用方法上简约化;其次语义理解能力强大,采用大模型机制后在多词、转义等多个方面效果显著,并在问答、搜索等场景提升明显;最后高效表现在基于大模型的搜索系统大幅降低了人力成本和数据成本。


image.png

加强大模型技术突破,联合研制行业大模型,并建设配套的工具平台和应用,这是大模型产业实践过程中重要的一个方面。同时,支撑大模型开发、训练和推理部署的深度学习平台也在持续进化。


飞桨升级让大模型性能更强、应用更便捷


如果没有飞桨支持,文心大模型就成了「无源之水、无本之木」。作为产业级深度学习开源开放平台,飞桨集核心框架、产业级模型库、开发套件、工具组件以及学习和实训社区于一体,能够标准化、自动化地支撑模型生产和应用。在 WAVE SUMMIT+ 2022 峰会上,飞桨生态也带来了最新进展:截至目前,飞桨已凝聚 535 万开发者,服务 20 万家企事业单位,基于飞桨创建了 67 万个模型


今日飞桨平台也迎来升级,在技术创新、功能体验和生态建设三个方面持续发力,坚定平台的产业级特性,引领大模型训练和推理核心技术创新,联动上下游龙头企业共创繁荣生态,加速产业智能化升级。

image.png

具体地,飞桨开源框架推出最新的 2.4 版本,围绕开发、训练及推理部署进行创新。在开发训练方面,飞桨动静统一的开发范式以及自适应分布式架构实现了大模型的灵活开发和高效训练。


推理部署方面,飞桨支持大模型高效推理,并提供服务化部署能力。而为了适配更多场景、更苛刻环境和更极致推理性能,飞桨利用计算融合等方式进行全方位性能优化,并通过软硬协同的稀疏量化进一步加速。同时飞桨提供了蒸馏裁剪等丰富的压缩策略,将模型进一步小型化,实现高效部署。


新发布的全场景高性能 AI 部署工具 FastDeploy 解决大模型部署中的痛点问题。FastDeploy 覆盖多端、边和云场景的支持,加之大量简单易用的设计,在性能上做了极致优化。最核心的是将大模型的压缩能力和推理引擎的推理能力无缝衔接,实现压缩和推理的协同。

image.png

为了让大模型产业落地更高效便捷,飞桨提供全套的产业化工具与平台,支持大模型的多样化应用。


一方面新发布了大模型训推一体开发套件 PaddleFleetX,让大模型的全流程研发更加便捷高效。大模型的开发、训练、小型化和推理对框架有很多不同的要求,因此 PaddleFleetX 开发套件瞄准了大模型的全流程,与飞桨的核心框架层及一系列底层能力全面对接,打通整个流程,在体验上实现升级。


另一方面,飞桨企业版 AI 开发平台 EasyDL 和 BML 也围绕大模型的技术应用进行了全新升级。在 EasyDL 零门槛 AI 开发平台预置了各种通用任务场景大模型,可以让 AI 应用开发者获得更好的模型训练效果。在 BML 全功能 AI 开发平台上,端到端的并行训练优化方案大幅提升了大模型训练性能;预置的基于大模型的场景模型生产线,让开发者在主流的场景开箱即用,快速构建大模型场景应用;新增的自动化推理服务监控能力,及时感知变化和问题,驱动反馈和迭代,让 AI 应用的高效迭代闭环。


image.png

无论是文心大模型还是飞桨平台的升级,百度正朝促进产业智能化这一方向前进。王海峰博士曾发表观点称,深度学习正推进人工智能进入工业大生产阶段。此后得益于深度学习的突破以及自身飞桨平台的建设与发展,人工智能开始广泛实现产业落地,与产业结合的深度和广度不断拓展。同时随着大模型为人工智能发展带来新的机遇,开始引领深度学习平台的发展方向,并在今年迈入产业落地的关键年。


百度一方面持续升级飞桨平台,在技术、场景和生态领域齐头并进,逐渐打造成为中国最强的开源开放深度学习平台,为 AI 的产业化落地打下坚实的基础;另一方面推出产业级知识增强文心系列大模型,并与头部企业、机构合作打造行业大模型,在促进这些企业业务效率提升的同时,通过向相关领域更多业务的能力泛化,进而实现整个产业的智能化升级。


可以这么说,飞桨深度学习平台和文心大模型已经组成一个完整、体系化的基础平台,未来持续的升级与迭代必将为产业智能化升级提供全方位支撑。


正如王海峰博士所说,「深度学习平台 + 大模型的布局贯通从硬件适配、模型训练、推理部署到场景应用的 AI 全产业链,夯实产业智能化基座,进一步加速产业智能化升级。」



技术小达人
目录
相关文章
云栖战略参考
|
3月前
|
人工智能 自然语言处理 文字识别
飞天技术观丨大模型如何真正在应用环节产生价值
大模型揭开了智能时代的序幕,其技术发展日新月异,创新成果不断涌现。可即便如此,最终不可避免地要回答一个问题:大模型如何真正实现商业化应用落地?
云栖战略参考
303 0
飞天技术观丨大模型如何真正在应用环节产生价值
技术小达人
|
10月前
|
供应链 安全 数据处理
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(1)
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(1)
技术小达人
45 0
技术小达人
|
10月前
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(2)
带你读《中国零售行业数智化成熟度白皮书》1.2致胜数智零售,提炼数据价值,构建竞争优势(2)
技术小达人
60 0
编程达人
|
搜索推荐 小程序 新金融
《未来保险 新金融时代》——二、保险科技的第一性原理——特征5:“长期陪伴式”运营
《未来保险 新金融时代》——二、保险科技的第一性原理——特征5:“长期陪伴式”运营
编程达人
159 0
-开发达人-
|
机器学习/深度学习 数据采集 人工智能
以落地考验价值,大模型的产业大考来了
以落地考验价值,大模型的产业大考来了
-开发达人-
117 0
码农工程师
|
人工智能 前端开发 机器人
从物种进化到价值再造,致远互联助力企业数字化转型升级
从物种进化到价值再造,致远互联助力企业数字化转型升级
码农工程师
208 5
从物种进化到价值再造,致远互联助力企业数字化转型升级
人民邮电出版社
|
供应链 安全
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7(一)
《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7
人民邮电出版社
388 0
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7(一)
人民邮电出版社
|
数据采集 存储 运维
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例6(三)
《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例6
人民邮电出版社
218 0
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例6(三)
人民邮电出版社
|
BI
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例3
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例3
人民邮电出版社
135 0
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例3
人民邮电出版社
|
前端开发 大数据 区块链
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7(二)
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7
人民邮电出版社
192 0
带你读《重构数字战斗力: 中小企业的数字化转型之路》第一章汽车及汽车零部件生产企业的 “上云、用数、赋智”之路 案例7(二)

热门文章

最新文章

  • 1
    阿里云备案审核一般多久能过?域名备案需要几天?
  • 2
    mysql加索引的时候到底会不会锁表.深入解析
  • 3
    Serverless 落地挑战与蚂蚁金服实践 | 8月12号云栖夜读
  • 4
    git笔记
  • 5
    Kbase #2: THP 功能对系统性能的影响
  • 6
    Softmax Classifier
  • 7
    AY的Dapper研究学习-基本入门-C#开发-aaronyang技术分享
  • 8
    0227show all segment level statistics
  • 9
    linux启动过程
  • 10
    活动安排(贪心)
  • 1
    【Azure微服务 Service Fabric 】如何转移Service Fabric集群中的种子节点(Seed Node)
    17
  • 2
    【Azure媒体服务 Azure Media Service】Azure Media Service中Stream Endpoint 说明 (流式处理终结点)
    21
  • 3
    【Azure Redis 缓存 Azure Cache For Redis】Redis出现 java.net.SocketTimeoutException: Read timed out 异常
    18
  • 4
    【API管理 APIM】APIM集成内部VNet后,自我访问出现(Unable to connect to the remote server)问题,而Remote Server正是APIM它自己
    17
  • 5
    【服务总线 Azure Service Bus】ServiceBus 队列中死信(DLQ - Dead Letter Queue)问题
    16
  • 6
    【API管理 APIM】APIM集成内部VNet时,常遇见的关于自定义DNS服务问题。
    10
  • 7
    【Azure云服务 Cloud Service】Cloud Service的实例(VM)中的服务描述Software Protection 与 Windows Defender, 如何设置Windows Defender Antivirus服务
    12
  • 8
    【事件中心 Azure Event Hub】关于EventHub中出现Error时候的一些问题(偶发错误,EventHub后台升级,用户端错误,Retry机制的重要性)
    15
  • 9
    【机器学习 Azure Machine Learning】使用VS Code登录到Linux VM上 (Remote-SSH), 及可直接通过VS Code编辑VM中的文件
    14
  • 10
    Swing 的线程安全分析
    12
  • 相关课程

    更多
  • 大数据知识图谱—钱大妈数据中台建设最佳实践
  • 云生态人才需求现状与职业规划
  • 大数据知识图谱—数据中台的智能进化—阿里巴巴十二年数据平台发展历程
  • 重庆烟草2024年度全市系统网信素养能力提升轮训(第二期)暨数字创新培训班
  • 产品化思维
  • 大数据知识图谱—亿滋中国X阿里云,释放新零售的数字化力量
  • 相关电子书

    更多
  • 借势大促数据驱动运营
  • 数据与技术,企业新零售转型的术与器
  • 百倍增长,数据驱动——面对正在崛起线下移动支付的数据运营
  • 相关实验场景

    更多
  • 奥运时刻!零代码生成奥运风格AI写真。
  • 【AI破次元壁合照】少年白马醉春风,函数计算一键部署AI绘画平台
  • 倚天大数据电商数据分析快速实践
  • 基于阿里云DeepGPU实例,用AI画唯美国风少女
  • 5分钟轻松打造应对流量洪峰的稳定商城交易系统
  • 快速开发光伏电站数字孪生运维系统
  • 下一篇
    【案例实战】SpringBoot整合阿里云文件上传OSS

    PHP网站源码深圳建站木棉湾企业网站改版塘坑网站搜索优化荷坳建设网站南澳企业网站建设南澳英文网站建设塘坑网站改版龙岗英文网站建设大鹏网站推广工具荷坳建站罗湖关键词按天扣费荷坳关键词按天扣费东莞seo民治网站优化按天扣费永湖关键词排名包年推广松岗网站设计大芬优秀网站设计大芬网站优化按天收费龙华网站建设塘坑网站搜索优化荷坳网站制作设计大鹏网站优化软件荷坳网络广告推广坪山seo网站优化木棉湾关键词排名坂田seo优化福永百度网站优化石岩网站推广宝安企业网站建设福永网站搜索优化歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

    PHP网站源码 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化