テンシリカの新128ビットプロセッサコアXtensa LX4の詳細がらかに
命令幅128ビット、データ幅512ビットと、極めて広いバス幅のマイクロプロセッサコアXtensa LX4を、IPコアベンダーのテンシリカ(Tensilica)社が発表した。このIPコアはシステムをU(ku┛)御するのではなく、定の演Qを行うことに徹した、データプレーン処理プロセッサである。

図1 命令幅、データ幅とも2倍以屬帽げたXtensa LX4 出Z:Tensilica
テンシリカは、コンフィギュアラブルなプロセッサコアを長としているIPコアベンダーだ。このデータプレーンプロセッサ(DPU)Xtensa LX4の狙いは、4GすなわちLTE-AdvancedといわれるLTE(long term evolution)の次の格の携帯電Bネットワークのモデム演Qや、顔認識機Δ筌汽Ε鵐標果を採り入れたテレビ会議システムなどのビデオ伝送処理演Qなどである。顔認識機Δ呂海譴らの画欺萢システムのセキュリティを保つ屬如要になるとしている。LTEでは最j(lu┛)データレートが150Mbpsだが、4Gは1Gbpsと常に高]の携帯電Bネットワークなる。
命令幅を128ビットと来の64ビットから2倍に広げたのは、VLIW(very long instruction words)命令によって並`処理しやすくするためだ。16ビットや24ビット命令を1クロックサイクル内でH数処理できる。また、ローカルデータメモリーの幅を来の128ビットから256ビット(LX3)と512ビットに広げたのは、キャッシュミスを(f┫)らすためのプリフェッチメモリとして使うためだ。メモリを~効に使えるようになる。
FLIX(Flexible Length Instruction eXtensions)命令セットを?y┐n)△┐討り、これを使って?4ビットから128ビットへ命令幅を\やすことができるため、1クロック当たりのオペレーションを独立して2倍実行することができる。しかも命令の幅はフレキシブルにシームレスに変えられる。XtensaのC/C++コンパイラはソースコードから並`処理すべきコードをO動的に抽出し、FLIX命令の中に複数のオペレーションをまとめることができる。これによって低いクロック周S数でも並`処理動作が可Δ砲覆蝓VLIW命令ではない来のプロセッサコアと比べて低い消J電で同じ性Δ鰓uる、あるいは同じ消J電で高い性Δ鰓uることができる。
プリフェッチメモリを設けたのは、レイテンシが長くなるような設でのクロックサイクル数を(f┫)らすためだ。システムメモリからのデータを使うiに予めフェッチしておくことで要なコードがやってくるとデータが△気譴討い襪燭瓠待ち時間すなわちレイテンシが]くなるというlだ。Dり出すメモリのZくにあるデータをストリーミングする時に最も~効に働く。DMAエンジンを別に{加する場合と比べ、メモリアクセスの最適化が~単にできるという。DMAエンジンを{加する場合にはソフトウエアを別に作らなければならない屬縫魁璽匹離船紂璽縫鵐阿要となる。
図2 キャッシュやローカルメモリを最j(lu┛)6個までeてる 出Z:Tensilica
テンシリカのDSUの咾澆蓮∈Y的なRISCコアやDSPコアよりも10〜100倍もの性Δ魴eつように最適化されており、コントロール機ΔDSP機Δ鴆せeつことができる点だという。
加えて、GPIOポートやFIFOポートのように、データを高]に転送させるためバスをバイパスさせる直接的なI/Oポートも使えるようにした。幅広いデータとFIFOを入出するキュー(Queue)によってXtensa同士や、来のRTLv路とも接できる。
テンシリカは、ソフトウエア開発ツールもTした。Xtensa DPUをカスタマイズした後は、命令セットを換えないため、サードパーティのアプリケーションソフトウエアや開発ツールのエコシステムを使うことができる。
国内ではマイコン開発мqシステムのメーカーであるソフィアシステムが、同社のJTAGエミュレータ・フラッシュライターであるEJSCATTでXtensa LX4に官できると最Z発表した(参考@料1)。
図3 Tensilicaの創立v兼CTOのChris Rowen
テンシリカの創立v兼CTOのChris Rowenによると、このLX4コアはある半導メーカーにすでにライセンス供与しており、これを使ったSoCを攵しているという。
参考@料
1. ソフィアシステム、テンシリカの最新コンフィギュラブル・プロセッサXtensa LX4に官