投资基础设施不再是事后诸葛亮,而是人工智能部署的未来

人工智能不再仅仅是一个未来的概念。它正逐渐成为商业运营和日常工具的核心。虽然新闻通常聚焦于大型语言模型 (LLM) 的能力或生成式人工智能(GenAI) 的突破,但如今真正的挑战在于支撑这一切的基础设施。

投资基础设施不再是事后诸葛亮,而是人工智能部署的未来

每个人工智能工具,无论是聊天机器人还是其他系统,都依赖于庞大的计算资源基础。因此,在许多消费者拥有的无缝用户体验 (UX) 背后,存在着一个复杂的硬件和软件系统,例如计算、存储和网络系统,它们需要以高速、高精度和可扩展性运行。虽然 GPU 通常被认为是人工智能发展的功臣,但它们大多只是更大谜团中可见的一块碎片。

随着企业不断部署人工智能解决方案,后端系统的压力也随之增加,导致企业不再询问如何将人工智能融入公司,而更多地询问如何高效且经济地实施人工智能。

由于需求旺盛,AI 工作负载对基础设施的考验也越来越大,因为训练大规模模型需要数千个 GPU 和数 PB 的数据以闪电般的速度传输。这不仅消耗大量电力,还给存储和网络系统带来巨大压力。

话虽如此,GPU 已不再是问题所在,因为 AI 团队的瓶颈现在不再是计算问题,而是由存储带宽和数据管道延迟造成的。因此,传统的 IT 基础设施已无法跟上其最初为通用工作负载构建的速度。 

为了应对这一挑战,一种新型的基础设施创新正在实施。它并非仅仅追求性能提升,而是重新思考系统最初的构建方式,强调更智能、模块化和 AI 原生的架构。

企业不再构建庞大的单片系统,而是转向模块化设计,逐步扩展,使基础设施的增长与人工智能的需求保持一致。这种方法可以更好地控制成本、可扩展性和其他因素。

现代人工智能还要求数据能够像处理数据的模型一样快速移动,而软件定义存储现在能够以传统存储成本的一小部分提供所需的速度、带宽和效率。

此外,人工智能正在向边缘扩展。在制造业、医疗保健和能源等行业,本地处理数据的需求日益增长。近数据和边缘部署可以降低延迟、保护敏感信息,并减少对集中式基础设施的依赖。

这种创新是朝着更高效、适应性更强、更安全、更适合更多业务的基础设施迈出的战略支点。

在全球论坛和其他行业活动中,基础设施决策正日益政治化,而不仅仅是技术讨论。“主权人工智能”的概念正在改变各国处理基础设施的方式,因为获得人工智能服务已不再足够,各国如今的目标是构建和控制自己的模型。这种转变源于这样一种认识:人工智能模型是由其开发数据和环境塑造的,反映了创建者的文化、价值观和历史。如果各国无法掌控自身的人工智能基础设施,就有可能采用带有与本国社会不符的外国偏见和假设的系统。 

这不再关乎数据控制,而是关乎技术独立,这促使从欧洲到亚洲的各个国家纷纷建立国内数据中心,训练本地模型,并投资主权基础设施。因此,企业领导者大多选择混合或本地解决方案来保护其敏感数据,遵守区域法规,并在不确定的地缘政治环境中保持自主权。

对控制和主权的日益关注自然引出了治理的另一个关键优先事项。随着人工智能系统在医疗、金融和国防等关键行业的应用日益广泛,对信任和问责的需求比以往任何时候都更加迫切。

现代基础设施必须支持模型可追溯性,使组织能够追踪模型的训练方式和时间,以及所使用的数据。这些功能不能再被视为事后诸葛亮,而必须从一开始就成为基础要素的一部分。

拥有最大或最炫模型的公司或国家不会“赢得”这场人工智能竞赛,但那些构建了可扩展、经济高效、受治理和主权的基础设施的公司或国家将会“赢得”这场竞赛。

基础设施不再是事后才想到的或幕后系统;它是任何组织的重要组成部分,并且正在成为企业部署人工智能的最关键部分之一。

作者:Roger Cummings 是 PEAK:AIO 的首席执行官,该公司致力于帮助企业扩展、管理和保护其 AI 和 HPC 应用。

本文来自作者投稿,版权归原作者所有。如需转载,请注明出处:https://www.nxrte.com/zixun/59344.html

(0)

相关推荐

发表回复

登录后才能评论