Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(半導)

AIメモリは、HBM2Eか、GDDR6か

AIチップと連動するメモリは、DRAMをスタックに積み_ねたHBM2Eか、それともGDDR6 SDRAMか、どちらが適しているのだろうか。その答えをRambusがこのほどらかにした(図1)。O動運転のレベル3になると認識の演Q処理でメモリバンド幅は200GB/sをえるようになる。では、どのメモリをIすべきか。

GDDR6 Memory System Four 16Gbps x32 GDDR6 DRAMs / HBM2E Memory System Single 2Gbps HBM2E Device

図1 HBM2E vs GDDR6メモリシステム 出Z:Rambus Whitepaper


AIの学{ξは]に高まってきた。2012Qから2019Qまでに30万倍も高まり、3.43カ月ごとに2倍というムーアの法Г鬚靴里粟いで\しているとRambusは述べる。にクルマの故を防ぐために完O動運転に相当するレベル5では、ダイナミックに交通信、筝鯆棉戎に反応し、素早く官すべき操作を予R・実行しなければならない。これはメモリにとって極めて高]のバンド幅が求められる。

AIメモリとして、Tbを言えば、学{にはHBM2E、エッジなどでの推bにはGDDR6が向く。これがRambusのTbである(参考@料1)。

メモリバンド幅の広いHBM2Eは、HBM(High Bandwidth Memory)の最新版である。HBMは、DRAMメモリを複数スタックしたもので、HBM2は最j8まで_ねていく。DRAM1の性Δ呂修譴曚氷發ないが、スタックすることでHBMとしてのトータルの容量と性Δ蝋發ぁ1ピン当たりのデータ転送レートは2 GT/s (Gigatransfers per second) になり、HBM2は256GB/sを実現できる。パッケージ当たりのデータ量は8GBとなる。HBM2の高位版がHBM2Eで、1ピン当たりの転送レートは3.2GT/sとなり、バンド幅は410GB/sと広い。最j12のDRAMチップをスタックでき、最j24GBとなる。


HBM2E Memory System with Single DRAM Stack

図2 HBM2EとSoCを配線するためにインタポーザをWする 出Z:Rambus Whitepaper


データ出ラインは1024本もあるため、コマンドとアドレスの配線も加えると1700本にも\える。k般のプリントv路基では官できないためシリコンのインタポーザを配線v路としてWする(図2)。まさに3D-ICそのものである。

HBM2Eは1個で410GB/sという広いメモリバンド幅を提供できるため、4個あれば1.6TB/sという高]システムができる。AIではデータセンターにおいて学{させているため、HBM2Eはデータセンターでの学{Wが適している。1個で高]・j容量であることからボードスペースのI約になり、スペースに厳しいデータセンターには~効である。また、消J電は低いため、データセンターの冷却コストを削できるというメリットもある。

ただし、問はコストと複雑さである。DRAMを最j12も_ねて実△垢襪海箸魎泙瘋てのパッケージング工が複雑になる。しかも工が長くなる分、歩里泙蠅睛遒舛襪燭瓠▲灰好隼\にもなる。

k気GDDR6は、これまでのGDDR SDRAMを踏したメモリであり、1チップながら性Δ郎任盥發ぁGDDR(Graphics Double Data Rate)は20Q間、ゲームやグラフィックス向けに設されてきた。GDDR6の電源電圧は1.35〜1.5V度と低く、データレートは16Gbpsと高い。GDDR5と比べると、データレートは2倍になっており、容量も2倍の16GBになる。


GDDR6 Memory System with Four DRAM

図3 GDDR6は来の実△悩僂燹―儘Z:Rambus Whitepaper


GDDR6は、HBM2Eに瓦靴董Å来のDRAM]\術そのものの長なので、パッケージングのMしさはなく(図3)、量\術そのものを使えるためコストは低い。しかも来のプリントv路基に実△任るため、低コストでJTプロセスをそのまま使える、というメリットがある。

ただし、メモリ1個のバンド幅は狭く、200GB/sのメモリシステムを構成する場合、4個要となる。これはGDDRの1ピン当たりのデータレートが16Gbpsであり、データバスは、1チャンネルあたり16ビットでこれが2チャンネル△┐討い襪燭32ビットのインターフェイスバスに相当する。すなわち、16Gbps×32=64GB/sのバンド幅になり、200GB/s以屬離轡好謄爐砲4個要であることがわかる。

GDDR6の問は、高]のチップがeつシグナルインテグリティ(SI: 信テ藜妥戞砲任△襦SIは、データ信、鯀るときのパルスS形が、pけDるときに歪んでいないことをす指Yである。ずと言ってよいほど、高]信、賄疏{`が長ければ長いほどパルスS形は歪む。このS形をするプリエンファシスや等価\術などが要になる。タイミングマージンや電圧マージンも小さくなるため、v路設vはチップのインターフェイスからパッケージ、実▲棔璽匹料蠍澎踊T性を考え、同時設が_要になる。

GDDR6のコスト、実\術などをHBM2Eと比較すると、エッジでの推bWが適しているとRambusは見る。量に向く屬ADASのレベル3を実現するために4個で済むというメリットもあるからだ。来のLPDDR5だと9個、LPDDR4なら13個も要となり、レベル3の推bシステムを構成するのに、GDDR6が最適といえそうだ。

参考@料
1. HBM2E and GDDR6: Memory Solutions for AI

(2020/07/17)
ごT見・ご感[
麼嫋岌幃学庁医 忽恢娼徭恢田消消消消消築| 晩云天胆篇撞壓濆杰| 窒継心議仔利嫋| 昆忽v天胆v冉巖v晩云v| 忽恢娼瞳殆繁牽旋| se94se天胆忝栽弼| 涙呱鱗畠科涙孳飢強只篇撞| 冉巖匯曝屈曝涙鷹裕田| 襖謹勸潤丗狼双涙涎符| 怜匚転転牽旋篇撞| 楳楳楳卅繁弼忝栽消消| 忽恢寔岱畠鹿mangent| 91篇撞忝栽利| 罕失戟諾繁母絃寄樫業繁悶簒| 消消av互咳av涙鷹av島患| 晩昆篇撞壓瀲伺| 冉巖忽恢娼瞳徭恢壓濂シ| 母絃繁曇匯曝屈曝眉曝膨曝 | 忽恢來弼av互賠壓濆杰| 18鋤冉巖侮匚牽旋繁笥| 壓瀉盞儿杰換恢| xxxcom壓濆杰| 撹繁窒継匯曝屈曝眉曝| 消消99冉巖利胆旋釈栽巉忽| 晩昆壓濆杰翰峽| 冉巖AV喟消涙鷹娼瞳只鮫| 天胆撹a繁頭壓濆杰款| 冉巖娼瞳窒継壓濆杰| 槻溺匯円寵匯円恂訪篇撞| 狃狃狃www壓濆杰潅盞儻瀁| 其然忽囂斤易篇撞| 忽恢壓篇撞濔瞳篇撞2021| 消匚弼娼瞳忽恢匯曝屈曝眉曝| 忽恢娼瞳謹繁P蛤涙鷹| 91嶄猟忖鳥yellow忖鳥利| 壓濆杰款瞳篇撞匯曝屈曝眉曝 | 嗽間嗽啣嗽寄嗽訪窒継篇撞殴慧 | 忽恢娼瞳消消消消消消| 4hc44膨拶www壓灑惟債侏| 忽坪娼瞳牽旋篇撞| 99忽恢娼瞳窒継鉱心篇撞|