日本擇泙譴離侫.屮譽EdgeCortix、本格的な收AIチップを?y┐n)?/h2>
日本擇泙譴離侫.屮譽紅焼スタートアップ、EdgeCortixが收AIの新しい半導チップ「SAKURA-II」をリリース(図1)、60 TOPS(Trillion Operations per Second)という高性Δ覆ら、来のチップよりも消J電がはるかに少ない8Wだとしている。チップ設だけではなく、モジュールやカードも作しており、拡張性もあり4個接で240 TOPSの性Δ魴eつ。

図1 EdgeCortixが開発したAIチップSAKURA-IIを搭載したモジュール
2019Q設立のEdgeCortixが`指したのは、低コストでしかも低消J電の收AIチップを提供すること。ミッションとして、クラウドレベルにZい性Δ鬟┘奪犬把鷆,、エネルギー効率と処理]度を桁違いに向屬気、顧客の運コストをj(lu┛)幅に削(f┫)すること、としている。これまでの主要投@家として、_吉孝(hu━)率いるSBI Investmentと、ルネサスエレクトロニクスがいる。
2020Qに「SAKURA-I」を開発、リリースしたが、この時はFPGAでAIアクセラレータを作り、その後専ICとした。今vの「SAKURA-II」が本格的な收AIとなる。パッケージされたICは19mm×19mmのサイズで、8GBあるいは16BGBのLPDDR4メモリを2個搭載したM.2モジュールボード(図1)で提供する。ボード込みでY10Wに収まっている。HBM(High Bandwidth Memory)ではなくLPDDR(Low Power Double Data Rate)4を(li│n)んだのはあくまでも適切なサイズでコストを下げるため。
收AIチップには、ソフトウエアライブラリやモデリング作りなども充実させる要がある。しかし、充実させればさせるほどコストがかかるため、EdgeCortixはオープンソースのソフトウエアやモデルを中核に(li│n)んだ。j(lu┛)模言語モデルLLMのLlama-2や画收のStable Diffusionなど数臆パラメータ度のオープンな收AIモデルをサポートしている。チャットGPTのようなGPT-3で学{した1750億パラメータという巨j(lu┛)なパラメータのAIモデルではない。
図2 EdgeCortix創業v兼CEOのSakya Dasgupta(hu━)
チップ屬任脇虻遒気擦討い覆v路をオフにするとか周S数を落とすなどの低消J電化の工夫は言うまでもないが、消J電の削(f┫)に最も効いたのは、おそらくデータフローコンピューティングにZいアーキテクチャを採したからかもしれない。SambaNovaがデータセンター向けAIチップのデータフローアーキテクチャを採して消J電をj(lu┛)幅に(f┫)らした(参考@料1)のに瓦靴、「当社はエッジ向けにデータフローアーキテクチャを開発した」と同社創業v兼CEOのSakya Dasgupta(hu━)(図2)は述べている。
データフローコンピューティングを動かすためにDNA(Dynamic Neural Accelerator)と}ぶフレキシブルでモジュラー(sh┫)式のニューラルアクセラレータを開発、コンピュートエンジン同士の配線をリアルタイムで再構成できるアーキテクチャとなっている。ダイナミックにグループ分けすることで効率の良い並`処理を実現できるようになった。Du(p┴ng)した\術を使ってEdgeCortixは、DNAエンジン同士のデータパスをリアルタイムで切りえることができるようになり、集積したメモリのバンド幅を(f┫)らすことができ、効率よく作業を実行できるという。
MERAソフトウエアスタックもDNAと共に演Q}順を最適化し、ニューラルネットワークにおけるタスクのスケジューリングのリソースの割り当てを最適化できるとしている。
チップの]にはTSMCの12nmプロセスを使した。今vのチップではb理設のRTL出までだが、次のチップは駘設(配・配線・レイアウト)もO社で行いたいとT気込んでいる。
参考@料
1. 「ニューロAIはデータフローコンピュータに乗ってくる時代になるか」、セミコンポータル、(2024/02/08)