28nmのFPGAはインタポーザW(w┌ng)でTbps実現、マルチコア内鼎能萢+解析に
湾のTSMCが28nmプロセスの量を開始、28nmプロセスをベースにしたFPGAを(sh━)国のザイリンクス(Xilinx)社とアルテラ(Altera)社がそれぞれ発表した。共に、28nmという微細化プロセスに長があるのではなく、ザイリンクスはシリコンインタポーザをW(w┌ng)した2.5次元ICを、アルテラは英ARMのCortex-A9のマルチコアを内鼎靴Cyclone VとArria Vをそれぞれ発表している。
TSMCがTできたのは、28HP(high performance)と28HPL(high performance low power)、28LP(low power)、28HPM(high performance mobile computing)4つのプロセスである。そのうちiの3つは量凮始しており、28HPMのみ今Qまでに量を開始する。
ザイリンクスのVirtex-7 2000Tは、TSMCの28HPLプロセスをW(w┌ng)している。このチップは、シリコンインタポーザとFPGAチップ4個をTSV(through silicon via)で_ね合わせて接、合68億トランジスタに及ぶICである。FPGAチップにTSVで楉鵡Α△気蕕縫泪ぅロバンプを設け、配線陲箸覆襯轡螢灰鵑離ぅ鵐織檗璽兇C4バンプを設け、それぞれを接している。これまでと比べ16〜20倍もの配線密度になる。FPGAチップ同士は直接接せず、共通のインタポーザの屬FPGAを4`並べる。インタポーザの配線総数は4層。ロジックエレメント数にして200万エレメント、ASICゲートに換Qして2000万ゲートになる。消J電は組み合わせv路にもよるが20W度。
ザイリンクスによると、これまで最j(lu┛)模のモノリシックFPGAは39億トランジスタで98万ロジックエレメントだという。ロジックW(w┌ng)率を考慮して機εには来最j(lu┛)のFPGAとして70万ロジックエレメントのFPGAを4個使い、配線で接する場合と同じ機Δ魴eつとして、消J電を見積もると、Q(ch┘ng)FPGAが20W、それらをTぶ配線を~動するための電が8Wとして、20W×4個+8W×4個=112Wとなり、消J電は新の5.6倍にも達する。
今vザイリンクスは、巨j(lu┛)なロジックLSIを4分割し、それらを1個のj(lu┛)きなシリコンインタポーザにフェースダウンで搭載する(図1)。インタポーザは単なる配線層だけであるが、Q(ch┘ng)FPGAのシリコンダイを4層配線で接している。インタポーザの裏C笋棒澆韻討い襯泪ぅロバンプをプリント基のバンプに接した後、キャップを被せて完成する。
ここまで巨j(lu┛)なFPGAになると、Tbpsのデータレートとして通信バックボーンでトラフィックのボトルネック解消への~デバイスとなる。
図1 4つのFPGAダイをシリコンインターポーザ屬暴言僉配線後、実△垢
アルテラは組み込み狙いで28LPプロセスW(w┌ng)
k(sh┫)、アルテラのチップは、組み込みをターゲットとし、プロセッサにARM Cortex-A9デュアルコアを集積したCyclone VとArria Vファミリを発表している。性Δ旅發ぅ廛蹈札奪汽灰△鯏觝椶靴霾と、ハードウエアをプログラムで組み立てる霾の両(sh┫)を集積することが可Δ砲覆蝓低コストで顧客仕様のカスタマイズを~単にできるようになる。これによってシステムコストを下げようという狙いがある。
このARMコア搭載のFPGAのデュアルコア霾では、単@度と倍@度の浮動小数点プロセッサや、ECCでメモリの読み出しエラーを(l┐i)するL2キャッシュ、Neonメディアプロセッサ、ECCきのマルチポートメモリコントローラ、QPSI/NANDフラッシュ/NORフラッシュのコントローラ、その他USB2.0やCAN、Ethernetなどの周辺インタフェースなども集積されている。さらに最j(lu┛)10Gbpsの高]トランシーバ、単@度・倍@度・3倍@度のDSPなども集積している。トランシーバはSERDES代わりにもなる。これにより、システムのj(lu┛)半を組み込みUで構成することができ、差別化したいv路だけFPGAでロジックを組むようにできる。
アルテラは開発環境も同時にD△掘ARMベースのソフトウエア開発ツールやFPGA向けのハードウエア開発ツールQsysシステム統合ツール、シミュレーションもTしている。RTLの検証が終了した時点で、デバイス?ji└)~のソフトウエアを開発することができ、ハード・ソフトの同時開発が可Δ砲覆襦これによって、開発期間を](m└i)縮できる。
このARMプロセッサ内伝塙UFPGAは、例えばカメラからの映疑(gu┤)を処理するv路ではARMベースのビデオ信(gu┤)処理を行い、映疑(gu┤)からクルマや人の動きなどを検出・解析するようなQ処理をFPGAがpけeつ、というようなサーベイランスへの応などに向いている。