免备案服务器融合基础设施如何加速AI之旅

 服务器问题     |      2019-09-24 11:52:48

  推动业务发展的技术的发展比以往任何时候都快,这使我们能做的事比我们想象的要多。曾经只在科幻电影中看到过的事物实际上正在变得栩栩如生。

  免备案服务器这些领域之一是人工智能(AI)领域。我们即将拥有机器来诊断癌症,绘制宇宙图,接管危险的工作并带我们四处走走。快速发展的不利方面是复杂性的增加。将基础架构和软件组合在一起以为基于AI的系统提供动力通常会花费数月的时间来构建,调整和调整,以使其最佳运行。

  更困难的是,人工智能基础设施通常由数据科学家部署,他们的技术敏锐程度与IT团队不同。

  Pure Storage为AI基础架构提供了交钥匙的方法

  在Nvidia的GPU技术大会(GTC)上,Pure Storage宣布了一项交钥匙解决方案,以简化AI基础架构的部署。该产品称为AIRI(AI就绪基础设施),是经过验证的优化解决方案,其中包括Pure Storage的FlashBlade,Arista的100 Gig-E交换机,Nvidia的四台DGX-1免备案服务器以及大规模运行AI所需的所有软件。 。该产品由Nvidia GPU云深度学习堆栈和Pure Storage AIRI Scaling Toolkit支持,使数据科学家可以在数小时内(而不是数月内)开始工作。

  该产品类似于其他融合基础架构产品,例如Cisco的FlexPod和Dell-EMC VxBlock,它们为企业在一天之内建立私有云提供了一种交钥匙的方式。我已经与这两种产品的客户进行了交谈,他们告诉我,融合产品消除了部署的所有复杂性,因此公司可以立即开始使用基础架构。融合基础设施是私有云的巨大飞跃,我希望它对AI产生类似的影响。

  DIY的AI方法可能充满复杂性和较长的交货时间

  使用AI时,对更简单选项的需求就更大了,因为免备案服务器AI过程(例如学习和推理)非常耗费数据。因此,它暴露了基础架构中的瓶颈,优化基础架构可能是一个漫长而漫长的过程。例如,TensorFlow软件是软件堆栈的一部分,仅它就有数百种选择。使用AIRI,所有的预配置都可以为部署组织完成。

  数据科学家是组织中收入最高的员工之一,因此,在基础架构组件放在一起的情况下让他们坐在那里浪费时间和金钱。

  AIRI具有高度的可扩展性和灵活性

  AIRI为组织提供了大量的计算能力和存储空间。该产品最初可以配置有单个DGX-1系统,该系统可提供1 petaflop的性能,但可以轻松扩展至4,使性能翻两番。Nvidia技术的一大优势是它可以线性扩展,因此四个DGX-1系统的性能是其4倍,而且性能不会下降。

  纯存储阿里宙斯·卡拉瓦拉

  Pure Storage阵列最多可容纳15个52 TB刀片,总容量超过750 TB。存储规模非常重要,因为免备案服务器AI在学习阶段需要大量数据。实际上,人工智能研究通常取决于使用生成对抗网络(GAN)来提高学习速度。借助GANS,AI可以生成大量的合成数据,从而增加了大量的真实数据。

  AIRI有趣的方面之一是它使用以太网连接组件。从历史上看,这样的产品会使用InfiniBand,因为速度更高而延迟更短。如今,特别是对于Arista,以太网延迟已经接近InfiniBand,并且速度相当。以太网具有非常积极的演进路线,可扩展到400 Gig-E,并且比InfiniBand更简单,更灵活,这使其成为更合乎逻辑的选择。

  我相信人工智能已经达到了一个转折点,并且在未来几年中它的使用将爆炸式增长。与使用私有云时类似,IT团队的任务是将为AI程序提供动力所需的所有必需的存储,服务器,软件和网络基础结构整合在一起。一种方法是购买所有构件并将其组合在一起,但是对于大多数组织而言,更好的方法是利用诸如Pure Storage的AIRI之类的交钥匙产品。