AIメモリは、HBM2Eか、GDDR6か
AIチップと連動するメモリは、DRAMをスタックに積み_ねたHBM2Eか、それともGDDR6 SDRAMか、どちらが適しているのだろうか。その答えをRambusがこのほどらかにした(図1)。O動運転のレベル3になると認識の演Q処理でメモリバンド幅は200GB/sをえるようになる。では、どのメモリをIすべきか。

図1 HBM2E vs GDDR6メモリシステム 出Z:Rambus Whitepaper
AIの学{ξは]に高まってきた。2012Qから2019Qまでに30万倍も高まり、3.43カ月ごとに2倍というムーアの法Г鬚靴里粟いで\しているとRambusは述べる。にクルマの故を防ぐために完O動運転に相当するレベル5では、ダイナミックに交通信、筝鯆棉戎に反応し、素早く官すべき操作を予R・実行しなければならない。これはメモリにとって極めて高]のバンド幅が求められる。
AIメモリとして、Tbを言えば、学{にはHBM2E、エッジなどでの推bにはGDDR6が向く。これがRambusのTbである(参考@料1)。
メモリバンド幅の広いHBM2Eは、HBM(High Bandwidth Memory)の最新版である。HBMは、DRAMメモリを複数スタックしたもので、HBM2は最j8まで_ねていく。DRAM1の性Δ呂修譴曚氷發ないが、スタックすることでHBMとしてのトータルの容量と性Δ蝋發ぁ1ピン当たりのデータ転送レートは2 GT/s (Gigatransfers per second) になり、HBM2は256GB/sを実現できる。パッケージ当たりのデータ量は8GBとなる。HBM2の高位版がHBM2Eで、1ピン当たりの転送レートは3.2GT/sとなり、バンド幅は410GB/sと広い。最j12のDRAMチップをスタックでき、最j24GBとなる。
図2 HBM2EとSoCを配線するためにインタポーザをWする 出Z:Rambus Whitepaper
データ出ラインは1024本もあるため、コマンドとアドレスの配線も加えると1700本にも\える。k般のプリントv路基では官できないためシリコンのインタポーザを配線v路としてWする(図2)。まさに3D-ICそのものである。
HBM2Eは1個で410GB/sという広いメモリバンド幅を提供できるため、4個あれば1.6TB/sという高]システムができる。AIではデータセンターにおいて学{させているため、HBM2Eはデータセンターでの学{Wが適している。1個で高]・j容量であることからボードスペースのI約になり、スペースに厳しいデータセンターには~効である。また、消J電は低いため、データセンターの冷却コストを削できるというメリットもある。
ただし、問はコストと複雑さである。DRAMを最j12も_ねて実△垢襪海箸魎泙瘋てのパッケージング工が複雑になる。しかも工が長くなる分、歩里泙蠅睛遒舛襪燭瓠▲灰好隼\にもなる。
k気GDDR6は、これまでのGDDR SDRAMを踏したメモリであり、1チップながら性Δ郎任盥發ぁGDDR(Graphics Double Data Rate)は20Q間、ゲームやグラフィックス向けに設されてきた。GDDR6の電源電圧は1.35〜1.5V度と低く、データレートは16Gbpsと高い。GDDR5と比べると、データレートは2倍になっており、容量も2倍の16GBになる。
図3 GDDR6は来の実△悩僂燹―儘Z:Rambus Whitepaper
GDDR6は、HBM2Eに瓦靴董Å来のDRAM]\術そのものの長なので、パッケージングのMしさはなく(図3)、量\術そのものを使えるためコストは低い。しかも来のプリントv路基に実△任るため、低コストでJTプロセスをそのまま使える、というメリットがある。
ただし、メモリ1個のバンド幅は狭く、200GB/sのメモリシステムを構成する場合、4個要となる。これはGDDRの1ピン当たりのデータレートが16Gbpsであり、データバスは、1チャンネルあたり16ビットでこれが2チャンネル△┐討い襪燭32ビットのインターフェイスバスに相当する。すなわち、16Gbps×32=64GB/sのバンド幅になり、200GB/s以屬離轡好謄爐砲4個要であることがわかる。
GDDR6の問は、高]のチップがeつシグナルインテグリティ(SI: 信テ藜妥戞砲任△襦SIは、データ信、鯀るときのパルスS形が、pけDるときに歪んでいないことをす指Yである。ずと言ってよいほど、高]信、賄疏{`が長ければ長いほどパルスS形は歪む。このS形をするプリエンファシスや等価\術などが要になる。タイミングマージンや電圧マージンも小さくなるため、v路設vはチップのインターフェイスからパッケージ、実▲棔璽匹料蠍澎踊T性を考え、同時設が_要になる。
GDDR6のコスト、実\術などをHBM2Eと比較すると、エッジでの推bWが適しているとRambusは見る。量に向く屬ADASのレベル3を実現するために4個で済むというメリットもあるからだ。来のLPDDR5だと9個、LPDDR4なら13個も要となり、レベル3の推bシステムを構成するのに、GDDR6が最適といえそうだ。
参考@料
1. HBM2E and GDDR6: Memory Solutions for AI