Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

AIの積和演Qに小さなDSPを数個並べたIPコアが々登場

ディープラーニングのニューラルネットワーク行`演Qに並`DSPv路をW(w┌ng)するIPがCEVAにき、Flex Logixからも出てきた。エッジAIチップに集積するためのIPコアである。ニューラルネットの演Qでは8ビットや16ビットのように小さな積和演Q(MAC)が適しているため、小さなDSPをj(lu┛)量に集積している。

ニューラルネットワークでは、基本的に1個のニューロンに積和演Q(データ×_み)がH数ぶら下がるH入1出のパーセプトロンをモデルにしている。ただし、出が1つでもH数のニューロンにデータを伝達していくため、電子v路のファンアウト出が出ているようなモデルを使っている。このため、AIチップやIPv路では、積和演Q(MAC: Multiply Accumulation)をH数並べた構]をしている。元々GPU(グラフィックスプロセッサ)にはMACが集積されており、しかも並`と言えるほど小さなGPUコアが集積されているため、NvidiaのGPUがニューラルネットワークの演Qによく使われている。

しかし、MACを集積している点ではDSPも同じだ。DSPは積和演Q専のマイクロプロセッサだからである。ただし、これまでのDSPは、演Q@度を_するため、32ビットを基本の単@度として64ビットの倍@度などの@密な演Qに向けられていた。DSPは、FFT(高]フーリエ変換)などのような通信モデム演Qに向いていた。しかし、AIニューラルネットワークに使うニューロンモデルでは、高@度よりも小さなMACを常にH数並べる(sh┫)が向いている。このため、8×16ビットとか7×7ビットのような小さなDSPをニューロンの数だけj(lu┛)量に集積している。

もともとDSPコアをセールスポイントとしてきたIPベンダーのCEVAは、最ZAI向きの小模・j(lu┛)量のDSPv路を並べたIPコアを先行してリリースしてきた。O動運転Zなど画鞠Ъ韻里茲Δ扮では、@のDSPというよりは画機Ρ誼のDSPコアとしてCEVA-XM4や、さらに映気叛@デープラーニングのDSPコアとしてCEVA-XM6がある。6月には、ドローンやロボット向けのAI SoCを設している中国のファブレス半導メーカーArtosyn Microelectronicsにライセンス供与したと発表している。


図1 Flex LogixのAIIPコアEFLX4K AIシリーズには数個の小さなDSPを集積 出Z:Flex Logix Technologies社

図1 Flex LogixのAIIPコアEFLX4K AIシリーズには数個の小さなDSPを集積 出Z:Flex Logix Technologies社


これに瓦Flex Logix Technologies社がリリースしたAIIPコア(EFLX4K AIシリーズ)は、数個のDSPコアとU(ku┛)御v路を集積しており、ニューラルネットワーク演Q専のv路となっている。CEVAのようなDSPコアを主としてきた企業と違い、Flex Logixは組み込みFPGA(eFPGAと}ぶ)を主としてきた。そのアーキテクチャは、H数のDSPコア+FPGAのIPコアとなっている。

AIのアルゴリズムでは、今は画気箟鞠Ъ韻箍嗣m認識のようなパターン認識にR`が集まっているため、Qみ込みニューラルネットワークに適したMACv路がHされてきた。しかし、ディープラーニングのニューラルネットワークは人間のj(lu┛)N皮をモデル化したもので、j(lu┛)N皮は覚や聴覚、行動U(ku┛)御、言語認識などをつかさどる組Eと言われている。Nはそれ以外にもストーリー性のあるエピソードを記憶しているL[や、}Bや身の運動を@緻にU(ku┛)御する小Nなど他の組EもHい。今後、Nをどのようにモデル化するかによって、ニューラルネットワークのモデルだけが適しているとは限らない。どのようなモデルにも専v路で表現できるデバイスがF(xi┐n)PGAであるから、アルゴリズムやそのU(ku┛)御をv路で表現するFPGAを残したうえで並`のDSPを集積したデバイスは今後も擇残る可性は高い。

今vFlex Logixがライセンス可ΔIPコアとしてリリースしたEFLX4K AI eFPGAコアは、8ビットのMACや16ビットMACをOy(t┓ng)に構成可Δ砲覆辰討り、例えば16×8ビットなども可Δ任△。EFLX4K AIコアは16nmプロセスなら441個の8ビットMACをeつ1.2平(sh┫)mmのコアとなり、1GHzで動作する。MAC演Qのスピードは、ワーストケースで441 GMAC/秒のスループットをeつ。7×7ビット構成にすると22 TMAC/秒という性Δuられるとみている。IPコア内の配線には同社のXFLX配線\術を使ってC積効率が高く、かつ再構成可Δv路を構成できるという。

このIPコアを使ってSoCを設する場合には、EFLX Compilerが使え、JTのソフトウエアフローがサポートしている。このコアは6〜8ヵ月あればどのようなプロセスへもインプリメントできるという。Flex Logixは元東のエンジニアだった古册(hu━)が日本法人の社長をめる会社。

(2018/07/06)
ごT見・ご感[
麼嫋岌幃学庁医 冉巖娼瞳及屈匈| 忽恢撹繁涙鷹匯屈眉曝篇撞| 嶄猟忖鳥av涙鷹音触窒継| 恷仟嶄猟忖鳥壓| 冉巖天胆晩昆匯曝| 娼瞳某沃忽恢徭壓濺佃盃| 忽恢匯雫谷頭忽囂噸宥三斤易| 冉巖娼瞳456| 忽恢娼瞳篇撞消| av撹繁壓澣舐| 腎易tk2匯匯篇撞忰vk| 晩昆冉巖萍鑁Ю鑚斛| 冉巖忽恢撹繁娼瞳涙鷹匯曝屈曝 | 來恂消消消消消築孟雑| 消消爺爺夊際際夊匚匚AV惜咳| 天胆嶄猟忖鳥匯曝| 冉巖天胆晩昆壓濂賛| 際際夊晩晩夊匚匚夊2022醍狭 | 壓仇鑓概貧的欺互c阻| 匯曝屈曝音触消消娼瞳| 撹繁際際弼忝栽| 消消99犯66宸戦峪嗤娼瞳匯| 晩昆壓濆杰諌伺屈曝眉曝| 冉巖av涙鷹匯曝屈曝岱聟戴as| 天胆晩昆冉巖忽恢涙濛| 冉巖娼瞳析望字| 際際弼忝栽匯曝屈曝| 窒継互賠a雫谷頭壓濂シ| 胆溺用和帥徨斑槻繁猶| 忽恢眉雫a眉雫眉雫勸翌| 嶄猟忖鳥91壓| 91忰湘弼忰遍匈| 仔利嫋弼篇撞窒継心涙和舜| 舞痛醍胆眉泣勝其亟寔| 晩昆怜匚戴y4480暴繁唹垪| 晩恢娼瞳匯屈眉膨曝忽恢| 溺繁闇蝕帥徨斑槻繁猶| 忽恢撹繁返字互賠壓濆杰翰嫋| 忽恢岱絃涙鷹寄仔aa頭| 窒継仔弼牽旋篇撞| 冉巖а‥爺銘消消娼瞳|