大模型时代,金山云以云为基石,差异化打法布局未来

原创
云计算
作为一家在云计算领域深耕多年的企业,金山云始终关注着技术发展的趋势,并积极探索如何帮助企业将这些技术应用于实际业务中。一方面,金山云夯实云计算基础,通过技术和产品能力的升级,助力大模型服务商更好地发展。另一方面,为了帮助特定领域行业用户提升效率,金山云围绕人工智能,探索行业大模型、模型平台以及知识助手等,以便更好地满足行业客户的业务需求。

在生成式人工智能浪潮的推动下,每个企业都面临着如何紧跟时代潮流、创新业务模式的挑战。而这些挑战也给诸如云厂商等来了更多的发展新机遇。

作为一家在云计算领域深耕多年的企业,金山云始终关注着技术发展的趋势,并积极探索如何帮助企业将这些技术应用于实际业务中。一方面,金山云夯实云计算基础,通过技术和产品能力的升级,助大模型服务商更好地发展。另一方面,为了帮助特定领域行业用户提升效率,金山云围绕人工智能,探索行业大模型、模型平台以及知识助手以便更好地满足行业客户的业务需求。

金山云副总裁钱一峰表示,金山云延续中立的优势,依托底层算力网络优势以及混合云部署差异化优势,聚焦业务场景,更好地满足企业的实际需求,帮助企业创造更多的价值。

2023:坚实基础与创新前行的双轨战略

2023 年,金山云采取了两步走的战略。首先,注重夯实基础,修炼内功其次,勇立潮头,紧跟大模型发展趋势,推出 MaaS 互信推理专区方案,解决模型及数据互信问题。

为了更好地服务企业客户,金山云推动了多款核心产品升级,包括云服务器、对象存储、网络产品。这些产品的推出,不仅提升了金山云的技术实力,也为进一步开拓大模型市场奠定了坚实的基础。

在计算方面,金山云第七代云服务器 X7 进行了全方位的升级搭载了第四代英特尔至强可扩展处理器,并支持英特尔 AMX 原生加速能力。与上一代产品相比,CPU 性能提升了 60%,内存也升级到了 DDR5,频率较上一代提升了 50%。融合金山云自主创新的加速技术,云服务器 X7 可有效提升模型推理性能。

对象存储作为金山云推出的第一个公有云服务,也经历了不断优化和升级。随着 AIGC 的崛起,对存储性能的要求也越来越高。为了满足这一需求,金山云已覆盖五个品类的对象存储产品,包括极速型存储、标准存储、低频存储、归档存储和深度冷归档。其中,金山云对象存储 KS3 极速型最高可提供 1Tbps/PB 的兑付带宽,相较于传统的机械硬盘(HDD)的对象存储性能提升了上百倍。这些创新的产品为 AIGC、存算分离和高性能计算等场景提供了强大的存储解决方案,确保客户的数据安全可靠。

针对大模型应用场景,金山云推出了互信虚拟私有网络(互信 VPC)。相对标准 VPC 而言,互信 VPC 对进出 VPC 的通信行为进行了更为严格的控制,帮助客户解决合规和互信问题。针对 HTTP、HTTPS 等应用层负载场景,金山云还推出了应用型负载均衡 ALB(Application Load Balancer),单实例最大支持 100 QPS,与云原生场景融合得非常好。当客户使用金山云容器服务 KCE 产品或自建 K8s 集群时,ALB 可作为 Ingress 部署,为业务提供网络流量调度服务。

金山云始终保持敏锐的市场洞察力,紧跟技术发展的步伐不仅注重产品的性能和效率,还致力于为客户提供全方位的服务支持。金山云将继续加强云上能力建设,拓展云上产品场景化能力助力企业实现数字化转型和创新发展。

态度:严守中立,做大模型服务商的坚实后盾

金山云的公有云在服务大模型服务商时,严守中立的立场,致力于成为大模型的助力者,为模型服务商提供云服务支撑,从训练到推理的全流程,通过技术可监测的形式,在模型使用过程中,对模型的使用方式和使用日志提供可接入、可审计的能力,确保模型使用的透明度和可审计性。

为了满足大模型运行的高性能要求,金山云在基础架构层面进行了深入优化。将云服务器通过 IB RoCE 方式连接,提供了部署验收、性能测试和故障报警等功能。这为模型运行提供了一个强大的基础网络,确保了稳定性和高效性。

在云算力网络层面,金山云借助自研的 IB/RoCE 等技术,结合端侧和网侧交付验收工具,实现了整个链路的探测能力,对全网的性能进行全面测试。这为大模型的流畅运行提供了坚实的后盾。

为了增强云上运行的可靠性,金山云持续丰富裸金属产品形态,推出了与 VPC 无缝对接的云托管管理机和进出 VPC 流量日志审计功能。这些功能为大模型的稳定运行提供了全方位的保障。

PaaS 层,金山云通过容器和 K8s 等技术,提供了故障检测、故障自动剔除等功能满足了大模型运营的稳定性需求确保了大模型的可靠运行。

值得一提的是,金山云发布了 MaaS 信推理专区 2.0 版本。这一版本基于金山云 IaaS和 PaaS 底座,实现了 LangChain的一键部署。它支持对接多个生态合作商业大模型和开源大模型,同时支持多种 Embedding 模型,并可无缝对接金山云全托管向量数据库 Milvus。这为企业开发者提供了一个简单易用、安全可信的一站式推理应用部署平台。


为了增强云上运行的安全性,MaaS 2.0 还提供了容器服务加密镜像解决方案。依托金山云裸金属服务,实现了从镜像加密、加密镜像上传到解密镜像运行的全流程模型安全运行。这一解决方案为企业提供了一个高度安全的大模型运行环境。

除了技术层面的保障,金山云还强调中立的立场和态度。金山云公有云产品中心负责人孙晓表示,金山云只触及容器服务这一层面,并确保大模型运行的可信度。通过技术手段和严格的管理流程确保了大模型在金山云平台上的安全和可靠运行。

据了解,诸多头部大模型服务商都是金山云的客户。尽管许多大模型服务商选择混合云部署,但金山云凭借其中立的立场和扎实的技术和服务创新,为大模型的发展提供了强有力的支撑。

聚焦:深入行业,满足特定领域的知识助手场景

面向企业级人工智能市场,金山云选择在企业内部比较基础、但上限又很高的场景,并面向工时价值高的特定领域,推出金山云轻舟智问知识助手产品。金山云人工智能与大数据产品中心负责人徐寅斐解释道,“‘基础’表达的是知识助手通过简单的问答对话框来进行交互,‘上限很高’指的是,当把模型的洞察力、理解能力、推理能力深度集成到企业内部流程后,知识助手又可以完成非常复杂的事情。”

为了实现这一目标,金山云围绕企业级知识助手场景制定了“一三一四”产品全景规划。一套知识问答的能力,可以以产品形态输出,也可以以元素化能力输出;三个核心模型,包括行业语言模型,文本分片,Embedding 模型;一个平台指的是金山云瀚海平台,围绕大模型预训练和业务微调阶段,提供数据-训练-推理-评测的全生命周期关键环节产品能力;四大功能,包括微调推理、数据加速、智能检索和文档智能。

值得注意的是,前文提到金山云严守中立,成为大模型的助力者,为何又自己做行业大模型呢?对此,钱一峰表示,金山云不做模型,但一定会做企业的应用落地和平台落地的支撑。企业级市场需求相对比较碎片化,也是看到客户有很多业务需求,但是没有很好应用来满足他们的业务诉求,因此,金山云才依托于底层基础设施的能力,探索行业模型。

据了解,金山云正逐步完善行业模型的全栈能力,其中金山云轻舟智问知识助手计划优先在公共服务和法律两大场景落地助力政务服务和办公,以及法律咨询、诉讼以及非诉讼场景方面提升业务效率。

展望 2024 年,会是应用爆发的一年,因此推理资源的降本增效尤为重要。金山云也会通过算力虚拟化构建统一的算力池,加速推理速度,帮助更多行业用户进行业务创新,提升业务效率。

责任编辑:鸢玮 来源: 51CTO
相关推荐

2011-08-18 09:59:19

微软云计算

2013-04-10 09:47:34

云服务连锁超市Vi-Cloud巍云平台

2017-11-02 09:40:28

人工智能GPU云主机UCloud

2018-04-03 12:53:21

GPU云主机AI

2015-11-04 14:35:10

Windows Azu微软微软智能云

2015-11-15 17:14:17

微软Azure智能云

2015-09-24 12:23:52

华为/行业云

2013-04-23 10:09:35

云计算亚马逊混合云

2017-03-29 18:39:39

2012-05-04 09:59:31

云服务

2013-08-05 09:45:16

云计算桌面虚拟化

2021-01-14 14:11:00

云原生金山云容器

2011-11-30 10:19:17

iPad游戏体验移动设计

2012-10-08 16:18:56

论坛

2011-03-16 19:17:57

汉柏差异化

2010-05-12 20:40:53

ITO运维管理摩卡软件

2011-03-17 12:53:06

2023-07-26 13:21:10

2018-07-30 09:33:23

泽塔云

2013-12-26 15:17:36

点赞
收藏

51CTO技术栈公众号