英伟达再放巨大招:AI的iPhone时辰降临“咱们正处在AI的iPhone时辰”黄仁勋说。
英伟达的GTC 巨大会在昨晚正式举办,黄仁勋也在此次活动中揭晓名为《切勿错过 AI 的决定性时辰》的主题报告,详细介绍了英伟达在 AI 范畴的相干规划和策略英伟达在此次活动中颁布了一系列的产物,从云效劳到硬件产物包罗万象。
而这些产物无一例外都缭绕 AI 范畴研发而他们出生的主要目的,是辅助企业放慢采取天生式AI英伟达在今日颁布了一系列的云效劳产物,首先要详细介绍的是全新的NVIDIA AI Foundations效劳,它能够为企业供给AI模子构建、创立利用等效劳。
该效劳源于英伟达的多项模子天生,包含言语模子NVIDIA NeMo 、视觉模子 NVIDIA Picasso 和生物学模子BIONEMO
NVIDIA NeMo 能够辅助企业疾速定制基本言语模子,NeMo 领有各类巨巨细模子,其参数范畴从80亿到5300亿不等,英伟达将会按期对其停止更新借助NVIDIA NeMo ,用户能够定制差别的巨大模子东西,揭晓包含信息检索、客户效劳等差别功效在内的AI利用程序。
而NVIDIA Picasso 则能够辅助用户开辟能够天生图象、视频和3D的利用程序Picasso 能够在用户输出文本以后,能够疾速创立响应的视觉内容,并将响应内容发送回利用NVIDIA NeMo 和 NVIDIA Picasso 均源于 NVIDIA DGX Cloud,用户能够经由过程浏览器大概 API 拜访这些效劳。
今朝 NVIDIA NeMo 曾经开放晚期拜访,而 NVIDIA Picasso还须要再等上一段时光Getty Images、Morningstar、Quantiphi和Shutterstock等公司 均已表现将会接入相干效劳。
NVIDIA DGX Cloud是英伟达揭晓的AI超等盘算效劳,它能够让企业即时拜访为天生式AI和其余突破性利用程序练习高等模子所需的基本设施和软件英伟达表现,企业可按月租用DGX Cloud集群,确保疾速轻松地扩大巨巨大多节点练习事情负载的开辟,而无需等候凡是需求量很巨大的放慢盘算资本。
据悉,别的,英伟达还为医疗范畴揭晓了 BioNeMo,他能够供给AI模子练习和推理,放慢yao物研发中最耗时和本钱最高的阶段,可放慢新蛋白质和医治方式的创立和基因组学、化学、生物学和份子动力学研讨想要AI 技巧疾速开展,当然也离不开硬件方面的支撑。
在昨天的主题报告中,英伟达也为AI产物揭晓了专用的 GPU 推理平台该平台领有四种差别的配套,能够对于差别的事情负载停止优化分辨对应了AI视频放慢、图象天生放慢、巨巨大言语模子(LLM)放慢和推举体系和LLM数据库。
包含:L4 Tensor Core GPU、L40 GPU、H100 NVL GPU和Grace Hopper超等芯片
此中最主要的是H100 NVL,它将英伟达的两个H100 GPU链接在一起,以安排像ChatGPT这样的巨巨大言语模子(LLM)“以后独一能够实践处置ChatGPT的GPU是英伟达HGX A100与前者比拟,当初一台挂载四对H100和双NVLINK的尺度效劳器速率能快10倍,能够将巨大言语模子的处置本钱下降一个数量级。
”黄仁勋说而L4是一款对于AI天生视频的通用GPU,用于放慢AI视频,能够供给比CPU高120倍的机能,能效提高约99%这款 GPU 能够优化视频XX与转码、视频内容考核、视频通话等机能今朝,英伟达GPU在AI视频生产技巧供应商Runway的产物中曾经供给了响应的技巧支撑。
除间接用于AI推理的GPU以外,黄仁勋还将眼光移向了光刻范畴黄仁勋在 GTC 上发布了一项名为 CuLitho 的新技巧,用以放慢半导体的设想和制作该软件利用英伟达芯片来放慢源于软件的芯片设想,并放慢用于在芯片上打印该设想的光刻掩模的物理制作之间的步调。
CuLitho 在 GPU 上运转,其机能比今朝的光刻技巧提高了 40 倍,能够放慢今朝每一年耗费数百亿个 CPU 小时的巨大范畴盘算事情负载”造 H100 须要 89 块掩膜版,在 CPU 上运算时制作一块那样得算两个礼拜,但要是用 H100 在 CuLitho 上运转那样只须要 8 个小时,“黄仁勋说道。