掀起年中诸神之战,国产大模型谁能决胜华山之巅

人工智能
在国内,大模型的发展如何?目前,大模型行业有哪些不足,以及未来将如何发展?今天,我们将进行深入探讨。

2023年过半,大模型并没有像元宇宙一样在爆火之后趋于冷静,相反变得越来越热闹。在国外,OpenAI持续发力GPT推出ChatGPT iOS版本,马斯克为Twitter抢购1万块GPU筹备大模型项目,亚马逊大力投资大语言模型和生成式AI......

如火如荼的大模型市场正在迎来“诸神之战”。 

大模型的爆火,不仅是AI技术的自我演进,更是云、数字化的又一次深化。

英伟达创始人、CEO黄仁勋将这一现象归纳为“AI的‘iPhone’时刻”来临。

ChatGPT火爆至今,AIGC、大语言模型、大模型在国内持续走热的深层次原因有哪些?在国内,大模型的发展如何?目前,大模型行业有哪些不足,以及未来将如何发展?今天,我们将进行深入探讨。

百模大战,大炼大模型

当前,我国人工智能大模型已发布79个。

随着众多AI企业的入局,AI大模型引燃了互联网大厂和科技大佬的激情,AI大模型的诸神之战已经打响。 

还有科技大佬入局:原美团联合创始人王慧文、前搜狗CEO王小川、前京东AI掌门人周伯文、阿里技术副总裁贾扬清、出门问问创始人李志飞等一众大佬争先加入ChatGPT掀起的创业热队伍。

AI大模型领域还有众多北京华丽的创业团队涌现,清华唐杰教授的智谱AI,黄民烈教授的聆心智能,清华大学NLP实验室的孙茂松、刘知远团队,深言科技岂凡超,以及循环智能杨植麟等等,都被头部VC赋予了颠覆行业的希望。

在政策层面,人工智能发展也得到了充分重视。此前召开的中共中央政治局会议提出,要重视通用人工智能发展,营造创新生态,重视防范风险。可以说,推动人工智能大模型产业化应用,是加快实现我国人工智能领域高水平科技自立自强的应时之举,也是提升国家竞争力、维护国家安全的关键举措。

以ChatGPT为代表的AIGC刺激下,国内AI大模型正在迎来奇幻革命,并进行一场诸神之战,谁会是最后的赢家,让我们拭目以待。

发展大模型之痛在哪里?

大模型具有“巨量数据、巨量算法、巨量算力”三大“巨量”特征。这对任何企业来说,打造一个大模型都不是一件容易的事情,需要收集海量的数据,采买海量算力,进行大量研发。比如,ChatGPT模型参数高达1750亿,而与之类似的模型,参数也从数百亿到数千亿不等。

国内AI大模型在训练与推理阶段或产生相当于1.1万台至3.8万台高端AI服务器的算力需求。以英伟达单片A100 GPU产品售价10万元、AI加速卡价值量占服务器整机约70%计算,则对应126亿元至434亿元增量AI服务器市场规模。 

人才也是人工智能大模型发展遇到的核心难题。《AIGC人才趋势报告》显示,自Open AI在2021年推出以来,对于AIGC相关的人才争夺就已经开始了。2021年1-2月,AIGC相关岗位招聘同比上升281.88%,而在2022年和2023年的1-2月,招聘数量分别保持了76.74%和31.3%的同比增幅。

只有AI与行业特性相融,才能真正实现技术扩散,带来帮助企业或行业降本增效的实际价值。

大模型要想得到长远健康发展,势必要结合行业、场景进行创新,通过场景创新+经济驱动,来支撑大模型发展。

但行业数据源封闭,孤岛化严重,难以提供训练大模型所需的大数据,满足行业AI需求,需要长时间探索。

寻求解决之道,大力发展大模型

应对这些挑战,抢占人工智能大模型产业发展制高点,必须加强源头技术创新,打赢软硬件基础设施国产化攻坚战,化解大模型关键核心技术被“卡脖子”的风险,多措并举推动人工智能大模型产业化应用。

算力先行。在国家、行业层面,应该推进新兴算力生态基础设施建设,实施高端算力芯片研发重大专项扶持计划,建立新型研发机构,推动国产高端算力芯片实现突破,推动新型算力网络基础设施建设的顶层设计,建设国家公共算力开放创新平台。人工智能企业也应该加大算力投入,通过创新推进自身演进、发展。 

数据生态的构建也尤为重要。完善国家公共数据开放标准和平台,推动高价值公共数据开放与多元化授权运营,引导行业、企业大数据有条件开放、融通并进场交易,形成多模态、多领域的大规模数据集。同时,也应该打造数据集精细化标注的众包服务平台和数据质量评估标准体系。

依托稳定可靠的算法开源生态。建立大模型算法及工具开源平台,完善具有稳定性、可靠性和安全性的算法监测标准和技术体系。企业也应该积极开展算法创新探索与应用,实现降本增效并创新商业模式,深化数字化转型并引领高质量发展。

持续前行,决战华山之巅

伴随而来的是AI大模型技术的影响力,有可能接近印刷术、蒸汽机、电力、互联网。

是机遇的同时也有着巨大的挑战:高算力意味着高成本,没有雄厚的资本支撑无法承担AI训练;AI大模型也对技术有了更严苛的要求,只有真正有技术水平的公司方能在这场AI大潮中屹立不倒;AI大模型需要大量的技术人才,这也是目前紧缺的。

但也有一些脚踏实地的团队正在研发大模型技术,推动大模型落地。这些只争朝夕的精神值得我们敬仰。

至少现在来看,需要中国企业持续探索、攀登。

责任编辑:庞桂玉 来源: 比特网
相关推荐

2012-06-27 10:00:07

金山快盘Android平台网盘

2011-06-10 11:19:30

WindowsMac

2010-03-22 10:01:26

2010-05-12 10:24:34

RIAWeb

2021-07-01 06:01:20

人工智能AI深度学习

2010-12-16 11:30:50

职场

2023-08-21 10:36:23

2012-08-15 10:02:17

2021-08-26 15:43:34

阿里巴巴数字经济

2012-04-10 17:37:57

2021-04-13 13:25:35

5G5G时代5G建设

2019-11-22 12:52:34

领鸟云

2018-05-09 15:17:31

VMware转型数字化

2015-06-05 16:34:04

炎黄盈动BPM

2020-06-22 17:42:37

华为

2019-06-26 05:29:44

深度学习KerasPyTorch

2010-02-04 09:57:40

FedoraUbuntu

2023-12-04 09:55:58

AI大模型
点赞
收藏

51CTO技术栈公众号