91成人在线免费观看,欧美激情一二三区免费视频,亚洲精品久久久久综合中文字幕

AIの積和演�Qに小さなDSPを数�個並べたIPコアが�々登場

2018年7月 6日｜�\術分析（デバイス設�& FPD）

ディープラーニングのニューラルネットワーク行�`演�Qに�並�`DSP�v路を�W(w┌ng)�するIPがCEVAに�き、Flex Logixからも出てきた。エッジAIチップに集積するためのIPコアである。ニューラルネットの演�Qでは8ビットや16ビットのように小さな積和演�Q（MAC）が適しているため、小さなDSPを�j(lu┛)量に集積している。

ニューラルネットワークでは、基本的に1個のニューロンに積和演�Q（データ×�_み）が�H数ぶら下がる�H入�1出�のパーセプトロンをモデルにしている。ただし、出�が1つでも�H数のニューロンにデータを伝達していくため、電子�v路のファンアウト出�が出ているようなモデルを使っている。このため、AIチップやIP�v路では、積和演�Q（MAC: Multiply Accumulation）を�H数並べた構�]をしている。元々GPU（グラフィックスプロセッサ）にはMACが集積されており、しかも�並�`と言えるほど小さなGPUコアが集積されているため、NvidiaのGPUがニューラルネットワークの演�Qによく使われている。

しかし、MACを集積している点ではDSPも同じだ。DSPは積和演�Q専�のマイクロプロセッサだからである。ただし、これまでのDSPは、演�Q�@度を�_��するため、32ビットを基本の単�@度として64ビットの倍�@度などの�@密な演�Qに向けられていた。DSPは、FFT（高�]フーリエ変換）などのような通信モデム演�Qに向いていた。しかし、AIニューラルネットワークに使うニューロンモデルでは、高�@度よりも小さなMACを��常に�H数並べる��(sh┫)が向いている。このため、8×16ビットとか7×7ビットのような小さなDSPをニューロンの数だけ�j(lu┛)量に集積している。

もともとDSPコアをセールスポイントとしてきたIPベンダーのCEVAは、最�ZAI向きの小��模・�j(lu┛)量のDSP�v路を並べたIPコアを先行してリリースしてきた。�O動運転�Zなど画�鞠Ъ韻里茲Δ扮��では、�@�のDSPというよりは画�機Ρ�誼�のDSPコアとしてCEVA-XM4��や、さらに映�気叛@�デ��璽廛蕁璽縫鵐庵�のDSPコアとしてCEVA-XM6��がある。6月には、ドローンやロボット向けのAI SoCを設�している中国のファブレス半導��メーカーArtosyn Microelectronicsにライセンス供与したと発表している。

図1　Flex LogixのAI�IPコアEFLX4K AIシリーズには数�個の小さなDSPを集積　出�Z：Flex Logix Technologies社

図1　Flex LogixのAI�IPコアEFLX4K AIシリーズには数�個の小さなDSPを集積　出�Z：Flex Logix Technologies社

これに�瓦�Flex Logix Technologies社がリリースしたAI�IPコア（EFLX4K AIシリーズ）は、数�個のDSPコアと�U(ku┛)御�v路を集積しており、ニューラルネットワーク演�Q専�の�v路となっている。CEVAのようなDSPコアを主�としてきた企業と違い、Flex Logixは組み込みFPGA（eFPGAと�}ぶ）を主�としてきた。そのアーキテクチャは、�H数のDSPコア＋FPGAのIPコアとなっている。

AIのアルゴリズムでは、今は画�気箟�鞠Ъ韻箍嗣m認識のようなパターン認識に�R�`が集まっているため、�Qみ込みニューラルネットワークに適したMAC�v路が�H�されてきた。しかし、ディープラーニングのニューラルネットワークは人間の�j(lu┛)�N皮��鬟皀妊覯修靴燭發里�、�j(lu┛)�N皮��覚や聴覚、行動�U(ku┛)御、言語認識などをつかさどる組�Eと言われている。�Nはそれ以外にもストーリー性のあるエピソードを記憶している�L�[や、�}�Bや身��の運動を�@緻に�U(ku┛)御する小�Nなど他の組�Eも�Hい。今後、�Nをどのようにモデル化するかによって、ニューラルネットワークのモデルだけが適しているとは限らない。どのようなモデルにも専��v路で表現できるデバイスがF(xi┐n)PGAであるから、アルゴリズムやその�U(ku┛)御を�v路で表現するFPGAを残したうえで�並�`のDSPを集積したデバイスは今後も�擇Ⅶ弔覯��④蝋發�。

今�vFlex Logixがライセンス可�Δ�IPコアとしてリリースしたEFLX4K AI eFPGAコア��は、8ビットのMACや16ビットMACを�O�y(t┓ng)に構成可�Δ砲覆辰討��、例えば16×8ビットなども可�Δ任△�。EFLX4K AIコアは16nmプロセスなら441個の8ビットMACを�eつ1.2平��(sh┫)mmのコアとなり、1GHzで動作する。MAC演�Qのスピードは、ワーストケースで441 GMAC/秒のスループットを�eつ。7×7ビット構成にすると22 TMAC/秒という性�Δ�uられるとみている。IPコア内の配線には同社のXFLX配線�\術を使って�C積効率が高く、かつ再構成可�Δ�v路を構成できるという。

このIPコアを使ってSoCを設�する場合には、EFLX Compilerが使え、�J�Tのソフトウエアフローがサポートしている。このコアは6～8ヵ月あればどのようなプロセスへもインプリメントできるという。Flex Logixは元東�のエンジニアだった古�册��(hu━)が日本法人の社長を��瓩覯饉�。

(2018/07/06)

ご�T見・ご感�[

AIの積和演�Qに小さなDSPを数�個並べたIPコアが�々登場

Breaking News

2025�Q2月のトップ10記�

キーワード

インサイダーズ