近日,戴尔在其 AI 工厂推出了全新的戴尔 AI 平台,该平台集成了英特尔最新的 Gaudi3AI 加速器,旨在为企业简化 AI 技术的采纳、集成与扩展过程。这一经过全面验证的端到端解决方案,结合了英特尔 Gaudi3硬件的强大性能、开源软件的灵活性以及戴尔在企业基础设施领域的丰富经验,为各行各业的 AI 转型提供了便捷的解决路径。
“与戴尔的合作,将英特尔 Gaudi3的强大能力带入了企业部署的整合解决方案中。这一平台优化了现代 AI 的需求,涵盖从大语言模型到边缘推理的多种应用,同时提供企业所需的灵活性和开放性,” 英特尔数据中心 AI 战略与产品管理副总裁 Saurabh Kulkarni 表示。
图源备注:图片由AI生成,图片授权服务商Midjourney
对于企业来说,AI 部署往往需要在高性能、可扩展性、灵活性和成本效益之间找到平衡。戴尔 AI 平台的推出恰好解决了这一痛点,Gaudi3加速器提供了与 Nvidia H100相比,70% 的更佳性价比,尤其在 Llama380B 模型推理方面表现突出。此外,该平台的可扩展架构能够随企业需求的变化而演进,确保 IT 专业人员在满足日益增长的需求时不会失去灵活性。
在 AI 工作负载的支持方面,戴尔 AI 平台的核心是优化过的 PowerEdge XE9680服务器。该服务器配备了八个英特尔 Gaudi3加速器,128GB 的高带宽内存(HBM)和每秒3.7TB 的带宽,非常适合处理大语言模型和计算机视觉任务。同时,它还配备了5代英特尔 Xeon 处理器,最多可支持64个核心,具备高效的复杂计算能力。
为了加速开发者的工作,该平台还集成了预验证的开源软件栈,支持 PyTorch、Hugging Face 等流行框架,并引入 Kubernetes 以实现灵活的资源调度和编排。此外,戴尔企业中心提供了一系列针对英特尔 Gaudi3优化的模型,帮助开发者快速实现应用。
戴尔 Omnia 作为高性能集群管理的开源工具,可以动态分配资源,使 IT 团队和开发者能够快速适应和优化不断变化的工作负载。这一平台通过与多种工具和框架的无缝集成,为企业提供了可靠性与灵活性的完美结合。
想了解英特尔 Gaudi3AI 加速器的更多功能,欢迎在2025年5月19日至22日的戴尔科技世界大会上访问英特尔展位654或戴尔展位833。
本文由「aiuc」编辑整理,文章链接:https://www.aiuc.net/61506
该文观点仅代表作者本人,平台仅提供信息存储空间服务。