Nvidia、ディープラーニングの総合を見せつける
Nvidiaは単なるファブレス半導メーカーにとどまっていない。AI(ディープラーニング)やHPC(高性Ε灰鵐團紂璽謄ング)のマシンを設するコンピュータメーカーでもある。最咾GPUであるTesla V100(図1)を使いこなす。AIでは学{だけではなく推bにGPUを動かすための推bソフトウエアTensorRTの新バージョンも開発した。O動運転プラットフォーム、IoTの推bアクセラレータも提供する。こんなeが浮かび屬る。

図1 Nvidia最咾GPU「Tesla V100」は5000個以屬GPUコアを並`に配した210億トランジスタを集積している
こういった最新のNvidiaの実を同社は2018Q3月に盜颪離汽鵐離爾膿したGTC 2018での発表内容を、4月下旬東Bで開されたNdivia Deep Learning Seminar 2018でo開した。ディープラーニングコンピュータとその仕組み、最新版の推bソフトウエアTensorRT 4、実際の応としてO動運転のシミュレータ「Drive Constellation」を発表した。さらに組み込みシステムやIoT端でもAIを使うためのNvidiaのディープラーニングアーキテクチャ(NVDLA)を英Armの「Project Trillium」に組込むためArmとも提携した。ハイエンドコンピューティングでは、レイトレーシング(Ray Tracing)という光の陰影を実際の^真並みので表現する}法をリアルタイムで実現するNvidia RTX\術も発表した。
世cにしたディープラーニングサーバNvidia DGX-2では、来1ラックに20のサーバを搭載し、それを15ラック並べた広いデータセンターに匹發垢襯妊ープラーニング処理ξをeちながら、1ラック分にも満たない5のサーバで実現できるコンピュータシステムを開発した。サイズは1/60、電効率は18倍という高性Δ淵灰鵐團紂璽燭箸覆辰拭これまでのコンピュータサーバーDGX-1は、最j8個のGPUを搭載していた。
このディープラーニングサーバDGX-2では、最も嗄なGPUであるNvidiaのTesla V100のメモリを来の2倍の32GBにj容量化し、最j16個のGPUを搭載している。16個のGPUをどのように構成するか。これまでは4GPUを1組として、四角形の頂点にQGPUを配する構成で互いに連Tし行き来できるアーキテクチャであり、8個のGPUの場合はこれを2組で互いにデータを行き来できる構成を採っていた。しかし16GPUとなると、もはやこのアーキテクチャは使えないため、バス擬阿瑤織侫.屮螢奪NVLinkインターコネクトチップを新たに設した(図2)。このチップにはクロスバースイッチを集積しており、18個のポートをeち、最j900GB/sでデータ転送する。このチップだけでも20億トランジスタを集積している。
図2 16個のGPUをNVLinkインターコネクトで100%接する
推bソフトウエアTensorRT 4をGoogleのディープラーニングフレームワークTensorFlow 1.7に統合し、推bアプリケーションをGPU屬納孫圓靴笋垢した。学{済みのニューラルネットワークを迅]に最適化し、検証、t開するためにWする。Googleがこのソフトを使い別のGPUで実行したT果、TensorFlow内でGPU推bの]度はこのソフトを使わない場合と比べ8倍高]のスループットがuられたとしている。
O動運転のための認識に使うAI機Δ鬟轡潺絅譟璽轡腑鵑垢襪燭瓩隣Z載シミュレーションプラットフォームNdivia Drive Constellationをリリースした。これは2のサーバからなり、それぞれが専のソフトウエアを搭載している。1番`のサーバにはNdivia DRIVE Simを搭載し、O動運転に要なカメラとミリSレーダー、Lidarなどのセンサをシミュレーションし、センサデータを收する。もう1のサーバにはAIZ載コンピュータNvidia Drive Pegasusと、O動運転のソフトウエアスタックが搭載され、あたかも実際のO路屬鯀行するクルマのセンサからuられたデータのように処理を行い、走行X況を指し、シミュレータにフィードバックされる。このHIL(Hardware in the loop)は1秒間に30vシミュレーション動作できる。
シミュレーションソフトのDrive Simは、暴風Uや吹雪などの異常気や、昼間のしい陵杆、牢屬琉鼎びX況、ありとあらゆるタイプの路Cや地形など、などさまざまなテスト環境を創り出すという。こういったX況の中でカメラ映気筌譟璽澄爾糧深oS形などのデータをDり込みシミュレーションする。
Nvidiaはまた、IoTのような軽いエッジデバイスにも推bプロセッサを搭載できるようにするため、CPUコアベンダーのArmとも提携した。Nvidiaのディープラーニングアクセラレータ(NVDLA)アーキテクチャをArmの「Project Trillium」プラットフォームに組み込み、機械学{を実現するという。NvidiaのNVDLAは、SoCのXavierをベースとして、ディープラーニングの推bアクセラレータを設する際のYを`指す無料のオープンアーキテクチャである。推bソフトウエアのTensorRTの最新版もサポートしている。
Nvidiaは、今や半導GPUチップからコンピュータハードウエアとソフトウエアまで}Xける演Qに化したコンピュータメーカーと言えるかもしれない。