AI 基础架构简介

复制 URL

借助红帽 OpenShift AI 在任何环境中更快地启动 AI

观看此视频,了解红帽® OpenShift® AI 如何通过集成工具、可重复的工作流程、灵活的部署选项以及可信的合作伙伴生态系统来加速 AI/ML 模型和应用整个生命周期。

 

随着人工智能(AI)在我们的日常生活中用的越来越多,建立一种能够实现有效和高效工作流程的结构就至关重要。这就是人工智能基础架构(AI 基础架构)的用武之地。 

精心设计的基础架构有助于数据科学家和开发人员访问数据、部署机器学习算法以及管理硬件的计算资源。

AI 基础架构结合了人工智能和机器学习(AI/ML)技术,来开发和部署可靠且可扩展的数据解决方案。正是这项技术使机器学习成为可能,让机器能够像人类一样思考。

机器学习是一项训练计算机找到模式、做出预测并从经验中学习且无需明确编程的技术。它可以用于生成式 AI,并通过深度学习实现,深度学习是一种用于分析和解释大量数据的机器学习技术。

AI 基础架构技术堆栈

技术堆栈是一组用于构建和部署软件应用的技术、框架和工具。我们可以想象这些技术是一层一层“堆”在一起,来构建整个应用的。AI 基础架构技术堆栈可以通过三个基本层更快地开发和部署应用。 

应用层允许人类和计算机与基本的工作流程工具进行协作,包括使用特定模型的端到端应用或面向最终用户的非特定应用。面向最终用户的应用通常使用开源 AI 框架来创建可定制的模型,并可以根据特定的业务需求进行定制。 

模型层包含了支持 AI 产品各种能力的关键检查点。该层需要用于部署的托管解决方案,模型层包括三个模型。
通用 AI:可复制人类思维和决策过程的人工智能。例如 OpenAI 的 ChatGPT 和 DALL-E 等 AI 应用。
特定 AI:根据非常具体和相关的数据进行训练,以实现更高精度的人工智能。例如生成广告文案和歌词这样的任务。
超本地化 AI:可以实现最高精度和相关性的人工智能,旨在成为该领域的专家。例如撰写科学论文或创建室内设计模型

基础架构层由构建和训练 AI 模型所需的硬件和软件组件组成。GPU(硬件)以及优化和部署工具(软件)等专用处理器等组件都属于这一层。云计算服务也是基础架构层的一部分。 

现在我们已经介绍了 AI 基础架构中涉及的三个层,下面我们来了解构建、部署和维护 AI 模型所需的几个组件。 

数据存储

数据存储收集和保留各种数字信息,即以位和字节形式存在的应用、网络协议、文档、媒体、地址簿、用户偏好。强大的数据存储和管理系统对于存储、整理和检索 AI 训练和验证所需的数据量非常重要。

数据管理

数据管理是指通过数据管理软件等手段,进行数据的收集、存储和利用的过程。通过数据管理,您可以了解自己掌握哪些数据、数据所在位置、数据归谁所有、谁可以看到该数据以及如何访问数据。通过适当的控制和实施,数据管理工作流可提供所需的分析洞察,帮助做出更好的决策。

机器学习框架

机器学习(ML)是人工智能(AI)的一个子类,是指利用算法识别一组数据中的模式并做出预测。机器学习框架提供了用于设计、训练和验证机器学习模型的工具和库。 

机器学习运维

机器学习运维(MLOps)是一组工作流实践,旨在简化机器学习(ML)模型的生产、维护和监控过程。通过借鉴 DevOps 和 GitOps 原则,MLOps 旨在建立一个持续不断演进的流程,使机器学习模型能够无缝地融入软件开发的整个生命周期。

精心设计的 AI 基础架构可为成功的 AI 和机器学习(ML)运维奠定基础。它有助于推动创新并实现高效。 

优势

AI 基础架构可为 AI 运维和企业带来不少好处。第一个好处是可扩展性,它能提供按需扩展和缩减运维规模的机会,尤其是使用基于云的 AI/ML 解决方案。第二个则是自动化,它允许重复工作以减少错误并增加可交付成果的周转时间。 

挑战

尽管 AI 基础架构具备众多优势,但它确实存在一些挑战。一大关键挑战是需要处理的数据的数量和质量。由于 AI 系统依赖大量数据来学习和决策,传统的数据存储和处理方法可能不足以处理 AI 工作负载的规模和复杂性。另一大挑战是对实时分析和决策的要求。该要求意味着基础架构必须快速高效地处理数据,这需要考虑集成合适的解决方案来处理大量数据。

应用

有一些应用可以解决这些挑战。通过红帽® OpenShift® 云服务,您可以快速构建、部署和扩展应用。您还可以通过主动管理和支持,提高一致性和安全性,从而提高效率。红帽边缘可帮助您在更靠近数据收集地点的地方进行部署,并获得可指导行动的分析。

AI 不仅影响我们的日常生活,还会影响我们的企业。凭借跨领域和行业的新发现和新体验,红帽的开源平台可以帮助您构建、部署和监控 AI 模型和应用,将未来掌握在自己手中。

红帽 OpenShift AI 可提供一个灵活的环境,让数据科学家、工程师和开发人员能够更快速、更高效地构建、部署和集成项目,享受内置安全防护和操作程序生命周期集成等优势。它提供 Jupyter 即服务,以及相关的 TensorFlow、Pytorch 和其他框架库。此外,几个软件技术合作伙伴(Starburst、IBM、Anaconda、Intel 和 NVIDIA)已集成到 AI 服务中,使用户更容易在现代云原生环境中找到和尝试新工具,从数据采集到模型构建,再到模型部署和监控。

我们的 AI 合作伙伴都使用红帽基础架构来构建并优化 AI/ML 的应用开发。他们能提供一系列解决方案,涵盖整个人工智能(AI)生命周期的不同阶段,包括数据集成和准备、AI 模型开发和训练,以及基于新数据对服务和推理(做出预测)进行建模。 

扩展阅读

文章

什么是生成式 AI?

生成式 AI 依赖基于大型数据集训练的深度学习模型来创建新内容。

文章

什么是机器学习?

机器学习是一项训练计算机找到模式、做出预测并从经验中学习且无需明确编程的技术。

文章

什么是基础模型?

基础模型是一种经过预训练的机器学习(ML)模型,能够执行一系列的任务。 

AI/ML 的更多信息

产品

围绕 AI 打造的产品组合可提供工具来训练、调优、提供、监控和管理红帽 OpenShift 上的 AI/ML 实验和模型。

一个企业级应用平台,包含一系列统一经过测试的服务,可基于您选择的基础架构将应用推向市场。 

搭载 IBM watsonx Code Assistant 的红帽 Ansible Lightspeed 是一项生成式 AI 服务,由 Ansible 自动化构工作者、运维人员和开发人员专为自动化同行们设计而成。 

资源

电子书

构建生产就绪型 AI/ML 环境的首要考虑因素

分析师资料

适用于 MLOps 的红帽混合云平台的总体经济影响™

网络培训课堂

借助开源和 Kubernetes 充分挖掘 AI 的价值