16nm FinFETプロセスのFPGAを量へ
16nm FinFETプロセスがいよいよFPGAを}始めに量が始まる。昨Q出荷されたIntelの新しいプロセッサ「Broadwell」にも14nm FinFETプロセスが使われたが、攵妌場がパイロット攵妌場であり、量妌場ではなかった。このほどXilinxが出荷する16nm FinFETプロセスのUltraScale+ファミリ(図1)が量チップといえそうだ。

図1 Xilinxの新FPGA、Ultrascale+アーキテクチャの 出Z:Xilinx
Xilinxは、TSMCが]するFinFETという3次元プロセスを~使するトランジスタを使い、2.5Dのインターポーザによるチップ実△鮑里蟾むことで、今vの\術を3D-on-3Dと}んでいる。FinFETはゲート直下の空層を3妓から閉じこめる\術であるため、消J電が低いことが長となっている。ドライブξを屬欧襪砲蓮▲侫ンの数を\やせばよい。フィンの数はW(チャンネル幅)に相当するため、フィンを\やすことでWをjきくする。
16nm FinFETプロセスで]されるUltrascale+ファミリは、3D IC(確にはインターポーザ屬琶数のチップを並べて接する2.5D)をWするVirtexシリーズと、款離泪襯船灰△鯏觝椶垢Zynqシリーズ、さらに広いメモリ帯域幅をeつKintexの3シリーズがある。この内、今vはVirtexとZynqを発表した。
16nm FinFETプロセスの性Δかすため、最j432Mビットのメモリを集積すると同時に、SmartConnectと}ぶ配線\術を採した(図2)。来、トランジスタの∨,鯣細化できても配線は微細化できなかった。エレクトロマイグレーション、ストレスマイグレーションなど信頼性の問があるからだ。このため、トランジスタの性Δ屬ってもLSIとしての性Δ屬らないと言われていた。
図2 レイアウトや配線によって最適化するSmartConnect\術 出Z:Xilinx
Xilinxが採した\術は、細くできない配線による影xを除去するため、配線を長くせず切りえる擬阿離ロスバースイッチやバス合をcけるためのアービタ、ストリームラインドパケット化など、レイアウトデザインによって配線を使い分けている。v路のスループットとレイテンシの仕様によって、どのスイッチを使うのが最適なのかをめる。インターポーザを介して2.5D実△垢訃豺腓蓮▲ぅ鵐拭璽檗璽兇砲皀好ぅ奪v路を設ける。このSmartConnectによって、同じ性Δ覆蘊嫡J電は20%削されたとしている。
同社が採したもうkつの\術はメモリの容量を\やしたことだ。FPGAダイ屬任来、並`接された浅いFIFO(First-in First-out)メモリやシフトレジスタなど数Kビットメモリを使っていた。数Mビット容量のメモリは外陬瓮皀蠅箸靴討い拭これでは高]動作は期待できない。今vは数Mビットのjきなメモリ(UltraRAM)をFPGAチップに集積することでメモリのヒット率がjきく屬り、レイテンシが]くなった。
さらにARMのマイクロプロセッサコアを集積したSoCシステムでは、高]のアプリケーションプロセッシングに64ビットのCortex-A53クワッドコアと、リアルタイム動作に32ビットのCortex-R5デュアルコアを集積した(図3)ほか、グラフィックコアとしてARMのMali-400MPや、セーフティ&セキュリティv路、メモリ、パワーマネジメントv路などを集積した。もちろんFPGAv路も集積、その中にv路ブロックとして、H.265ビデオコーデックと、高]インタフェースv路、トランシーバv路、UltraRAMを集積した。
図3 ヘテロのマルチコアを集積したSoC、Zynq カスタマイズ霾のみFPGAを使う 出Z:Xilinx
Xilinxは来の28nmの7シリーズと、今vの16nm FinFET\術のSoCとを比較した。このUltraRAMとSmartConnectの両気鮹いた場合、PCIeモジュールでの画欺萢では同じ消J電で性Δ蓮Å来の525Operations /秒が1880Operations /秒と3.6倍に屬った。k気如Ultrascale+アーキテクチャを集積したMPSoCのベンチマークでは、1080pのフルHD画気4K2Kに変換するビデオ会議の応では、1ワット当たり5倍の性Α⊇o共W放送のソフトウエア無線の応では1ワット当たり4.8倍の性Δ鬚修譴召贅uているという。このUltrascale+アーキテクチャでは2015Qに合50本以屬離妊競ぅ鵑テープアウトされる予定だとしている。