プリファードネットワークス、AI学{チップを顔見世
ディープラーニングのフレームワークChainerを提供しているプリファードネットワークスが学{を]期間で可Δ砲垢襪燭瓩離船奪廚魍発、セミコンジャパン2018の会場で発表した。学{可ΔAI専ICは、初めて。学{ではこれまでのNvidiaの牙城を崩す初めての専ICとなる。

図1 32.2mm×23.5mmの巨jなシリコンを4個搭載したAIIC基 出Z:プリファードネットワークス
この学{チップ「MN-Core」は、チップC積32.2mm×23.5mmという巨jなシリコンチップを4個基に⊂し(図1)、Cuのフタをしてパッケージングした(図2)。それを実△靴織棔璽匹箸修屬縫侫.鵑畔XフィンをDりけたボード(図3)、ボードを4搭載したコンピュータ(図4)、そしてサーバーラック(図5)を見せた。
図2 AIダイ4個をパッケージングしたICをプリント基に実
図3 AIICのパッケージ屬吠Xフィンとモータのファンを搭載
図4 AIICボードを4搭載したサーバ
図5 コンピュータサーバを4ラックに搭載
BGAパッケージに収容したAIICは、6456端子をeち、基にボンディングしている。チップの]はTSMCの12nmプロセスをいた。1パッケージの性Δ話瓜@度演Qで131 TFLOPS(テラフロップス)と高く、半@度での性Δ524 TFLOPSとなる。単@度での性Δ1パッケージで0.26 TFLOPS/Wとなり、消J電は500Wと見積もっている。
1チップで100Wをえるため冷却はLかせない。X伝導率の高いCuを4チップCに使った屬砲修励Xを逃がすための放Xフィンをけ、そのフィンの表C積をnぐために薄い金關でフィンを作り、さらにモータのファンで風を送り冷却する。ボード1でAIIC1個というぜいたくな構成だが、フィンのスペースを広くとらざるをuないため、ボード1がAIプロセッサ1個という構成になる。
コンピュータサーバは、AI専機であり、NANDフラッシュを使ったNVMeと、SATAに官したストレージも搭載している。このためのをU御するCPUも搭載している。
プリファードが学{のAIプロセッサを開発したのは、デープラーニングの学{プロセスの時間を]縮するためだ。来なら1カ月かかる学{プロセスをせめて1週間に]縮したい。グラフィックス専の@チップではなく、専チップならニューロンのモデルのようにMAC(積和)演Qとメモリをセットにして性Δ屬欧襪海箸できる。
推bチップでは、16ビット@度を8ビットに落として性Δ鬚曚箸鵑品僂┐困望嫡J電を半分以下にすることが可Δ澄しかし、学{チップではニューラルネットワークを構成するニューロンの_みを学{のために変えていくバックプロパゲーション(誤差逆伝魍{)において、ほんのわずかでも@度を落とせないという。このため、行`演Qコアの@度を、16ビット(半@度)、32ビット(単@度)、64ビット(倍@度)の3|類をTした。
学{させるコードはアプリケーションごとに異なるが、ニューラルネットワーク向けのChainer(チェイナー)フレームワークをアップグレードしてもこのチップを使えるように設しているという。まず、社内で実証実x(PoC)を行う画だ。学{のAIプロセッサでは消J電をどこまで落とせるか、AIチップの課はこれからだ。