NVIDIA 加速数据科学

GPU 加速数据分析工作流程

利用数据科学,全球各地的企业可以分析和优化业务流程、供应链、科学研究、产品和数字体验。借助 RAPIDS(新型开源软件库集),GPU 计算正在颠覆数据科学领域,加速机器学习、分析和数据发现,从而以更快的速度获得更精准的结果。

特性和优势

简单易用

更大限度提升工作效率

减少获得宝贵见解的等待时间,并加快提升投资回报率。

简单易用

简单易用

只需集成简单的开源软件并对代码进行极少量更改,便可加速整个 Python 工具链。

事半功倍

事半功倍

将机器学习训练的速度提升 215 倍之多,执行更多迭代,增加实验并进行更深入的探索。

事半功倍

提高准确度

更快的模型迭代,以获得更好的结果和性能

成本效率

成本效率

降低数据科学基础设施成本,同时提升数据中心效率。

成本效率

总体拥有成本

显著降低数据中心基础设施成本

 

使用 NVIDIA GPU 训练 XGBoost

GPU 加速的 XGBoost 为世界领先的机器学习算法带来了颠覆以往的性能。凭借速度明显快于 CPU 的性能,数据科学团队可以更大限度地提高预测准确性和商业价值。

Data Prep

XGBoost

End-to-end

立即了解如何开始使用 GPU 加速的 XGBoost

NVIDIA GPU 数据科学解决方案

了解各种不同的 NVIDIA GPU 解决方案提供的惊人的加速

PC

开启机器学习之旅。

工作站

新一代数据科学工作站。

了解详情 

数据中心

适用于企业生产的 AI 系统。

功能多样的加速机器学习。

GPU 加速业务实际应用

更大限度提升机器学习工作流程的绩效、工作效率和投资回报率。

Rapids:数据科学库套件

RAPIDS 基于 NVIDIA CUDA-X AI 而构建,融合了超过 15 年的 NVIDIA® CUDA® 开发和机器学习专业技术。这是一款功能强大的软件,可以完全在 NVIDIA GPU 中执行端到端数据科学训练命令流,将训练时间从几天缩减到几分钟。

NVIDIA RAPIDS 流
借助 RAPIDS 实现端到端加速

RAPIDS 是一种 GPU 加速数据科学平台,是由 Apache Arrow 提供支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 进行合作,可以加快核心 Arrow 库的创新步伐,并有助于在分析和特色工程工作负载方面更大限度地提升性能。

– Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Pandas 创建者

在 Databricks,看到 RAPIDS 在加速 Apache Spark 工作负载方面的潜力,我们都无比激动。我们有多个正在进行的项目,可以更好地将 Spark 与本机加速器集成,包括 Apache Arrow 支持和使用 Project Hydrogen 的 GPU 调度。我们相信 RAPIDS 会是个令人兴奋的新机遇,可以扩展客户的数据科学和 AI 工作负载。

– Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

我使用 RAPIDS XGBOOST 获得了 24 倍加速,现可借助 8 块 GPU 在单个节点上运行规模超大的机器学习 (ML) 工作负载,以取代原先的数百个 CPU 节点。XGBOOST 竟然可以这么快!?

– 流媒体公司

我以前的瓶颈是 I/O。......10 分钟只能为 10 家商店提取数据(约一百万行)。借助 RAPIDS,我们可以在不到 3 分钟内为大约 6000 家商店提取数据(数百万行)。在旧版基础设施上,这个规模可能很容易就会花费我们 4 天时间......真是太棒了。

– 一位拥有 6000 家门店的中端市场专业零售商

RAPIDS 是一种 GPU 加速数据科学平台,是由 Apache Arrow 提供支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 进行合作,可以加快核心 Arrow 库的创新步伐,并有助于在分析和特色工程工作负载方面更大限度地提升性能。

– Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Pandas 创建者

在 Databricks,看到 RAPIDS 在加速 Apache Spark 工作负载方面的潜力,我们都无比激动。我们有多个正在进行的项目,可以更好地将 Spark 与本机加速器集成,包括 Apache Arrow 支持和使用 Project Hydrogen 的 GPU 调度。我们相信 RAPIDS 会是个令人兴奋的新机遇,可以扩展客户的数据科学和 AI 工作负载。

– Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

我使用 RAPIDS XGBOOST 获得了 24 倍加速,现可借助 8 块 GPU 在单个节点上运行规模超大的机器学习 (ML) 工作负载,以取代原先的数百个 CPU 节点。XGBOOST 竟然可以这么快!?

– 流媒体公司

我以前的瓶颈是 I/O。......10 分钟只能为 10 家商店提取数据(约一百万行)。借助 RAPIDS,我们可以在不到 3 分钟内为大约 6000 家商店提取数据(数百万行)。在旧版基础设施上,这个规模可能很容易就会花费我们 4 天时间......真是太棒了。

– 一位拥有 6000 家门店的中端市场专业零售商

RAPIDS 是一种 GPU 加速数据科学平台,是由 Apache Arrow 提供支持的新一代计算生态系统。NVIDIA 与 Ursa Labs 进行合作,可以加快核心 Arrow 库的创新步伐,并有助于在分析和特色工程工作负载方面更大限度地提升性能。

– Wes McKinney,Ursa Labs 总经理,Apache Arrow 和 Pandas 创建者

在 Databricks,看到 RAPIDS 在加速 Apache Spark 工作负载方面的潜力,我们都无比激动。我们有多个正在进行的项目,可以更好地将 Spark 与本机加速器集成,包括 Apache Arrow 支持和使用 Project Hydrogen 的 GPU 调度。我们相信 RAPIDS 会是个令人兴奋的新机遇,可以扩展客户的数据科学和 AI 工作负载。

– Matei Zaharia,Databricks 联合创始人兼首席技术官,Apache Spark 创始人

我使用 RAPIDS XGBOOST 获得了 24 倍加速,现可借助 8 块 GPU 在单个节点上运行规模超大的机器学习 (ML) 工作负载,以取代原先的数百个 CPU 节点。XGBOOST 竟然可以这么快!?

– 流媒体公司

我以前的瓶颈是 I/O。......10 分钟只能为 10 家商店提取数据(约一百万行)。借助 RAPIDS,我们可以在不到 3 分钟内为大约 6000 家商店提取数据(数百万行)。在旧版基础设施上,这个规模可能很容易就会花费我们 4 天时间......真是太棒了。

– 一位拥有 6000 家门店的中端市场专业零售商

合作伙伴生态系统

RAPIDS 面向数据科学和分析领域的高层企业领导者,并逐渐被他们接纳。

大数据、分析、可视化

Anaconda
BlazingDB
DataBricks
FastData
Graphistry
H20.ai
Kinetica
MAPR
Omni Sci
Sqream
Uber

企业数据科学平台

IBM
Oracle
SAP
Sas

存储

DellEMC
HPE
IBM
NetApp
Pure Storage

深度学习

Chainer
PyTorch

在线研讨会

借助 RAPIDS 加速数据科学工作负载

借助 XGBoost 提高机器学习性能和工作效率

RAPIDS 助力实现医疗保健领域的 GPU 加速数据科学

借助 RAPIDS 和 DGX-2 实现端到端数据科学加速

参加即将举办的活动以建立联系

  • AnacondaCON | 德克萨斯州奥斯汀 | 4 月 3-5 日
  • Spark AI | 加利福尼亚州旧金山 | 4 月 23-25 日
  • SciPy | 德克萨斯州奥斯汀 | 7 月 8-9 日

探索 GPU 加速的硬件解决方案