Semiconductor Portal

» セミコンポータルによる分析 » \術分析 » \術分析(デバイス設& FPD)

Imagination、CNN推bアクセラレータAIコアを提供

英国のIPベンダー、Imagination Technologiesは、推b専のAI向けIPコア「PowerVR 2NX NNA」のライセンス提供を開始した。クラウドを通すとレイテンシがくなるエッジやフォグなどのに使うだけではなく、モバイルにも使えるほど消J電は少ないという。「セキュリティAIをエッジにeってくる」と同社PowerVR 担当DirectorのChris Longstaffは喞瓦垢襦

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff

図1  Imagination Technologies PowerVR 担当DirectorのChris Longstaff


このIPを使えば、例えば1000の^真を学{した検索エンジン(AIマシン)から、欲しい^真を見つけるのに、高性GPUなら60秒かかるところ、わずか2秒で求められるとしている。バッテリ命の1%の時間を使って分類できる^真数は、GPUの2400に瓦靴、42万8000にものぼるという。また、ドローンではハードウエアを搭載しない場合、(j┫)颪ら10~15m`れていないと演Qが間に合わず衝突してしまうが、このIPコアを集積していれば1mまで接Zしても衝突をcけられるとする。

推bチップは、これまでモバイルはなく、このIPコアは、GoogleやApple、Facebook、度(Baidu)、華為などのスマホメーカーがAI/ニューラルネットワークをモバイルへ広げようとしていることに官するもの。このIPコアは、アクセラレータとして機Δ掘CPUと共に動作する。モバイルとして、低消J電と小さなv路C積が要で、オプションだがMMU(メモリ管理ユニット)も集積できる。Androidをサポートしている点も徴だ。ちなみに16nmプロセスでこのIPコアを集積すると1.1mm2度のC積だとしている。

Imaginationがニューラルネットワークアクセラレータと}んでいるこのIPコアは、ニューラルネットワークの推bアクセラレータとしての性指数である推b数/秒や、コスト効率を表す推b数/mm2、消J電を表す推b数/mWという指Yで表すと、数Cをo開していないがすべて最高だとしている。またアクセラレータであるため、演Q処理するためのハードウエアを△┐討り、ドライバのホストCPUとやりDりする。

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies

図2 PowerVR 2NXファミリは推bIPコア 出Z:Imagination Technologies


このIPコアはあくまでも推bのIPコアである。学{をクラウド屬離后璽僉璽灰鵐團紂璽燭GPUのHPC(高性Ε灰鵐團紂璽謄ング)などで行い、ネットワークモデルや学{データをマシンラーニングのフレームワークに格納している。この中に、オープンソースのデープラーニングライブラリTensorFlowやCaffeなどをeっている。これらのライブラリから(j┫)とするパターンを推bするための形式に変換するのにImaginationが提供するPowerVR NNA Toolを使う。Imaginationは変換ツールに加え、DNNのAPIも提供する。

ニューラルネットワークの演Qは基本的に行`演Qで、積和演Qが中心になる。データに学{の_みをXけQしネットワークてのニューロン接分を加えるという作業が要だからである。このためこれまではGPUやDSPが向いていたが、データビット数はw定しており、演Qすべき(j┫)颪砲茲辰栃僂┐蕕譴覆った。このため、無Gな演Qも含まれており、消J電がj(lu┛)きかった。GoogleのTPUは、レイヤーごとにデータビット数を変えることで、消J電を1/10に下げたという実績がある。このため、GPUやDSPではなく、AI専のチップが求められている。

このPowerVR 2NX NNAでは、画鞠Ъ叡のCNN(Qみ込みニューラルネットワーク)演Qに要な、画気Qみ込みからフィルタをかけたアクティベーション層、レイヤーを縮小するプーリング層、最後に完接層に至る操作をて、このIPで行うデータフローシステムを△┐討い(図3)。このT果、最小のC積で最j(lu┛)のMAC数/クロックを演Qできる。

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies

図3 PowerVR 2NXはCNNの動作をて実行する 出Z:Imagination Technologies


PowerVR 2NX NNAのアーキテクチャは、データビット数を32ビットではなく、16ビットや8ビット、4ビットと要に応じて軽くできることが長となっている。積和演Qに要なデータビットと_みけのビット数は、レイヤーごとに8ビット~4ビットで設定できる。

MACはY構成として拡張性をeたせており、16ビット/クロックのMAC(積和演Q_)を128~1024個、8ビット/クロックのMACを256~2048個△┐討り、ニューラルネットワークのレイヤーごとに最適なビット数を(li│n)ぶことができる。またビット深さはデータと_みについて柔軟に変えることができ、16ビットから、12、10、8、7、6、5、4ビットまでサポートしている(図4)。加えて、このアクセレレータ内でデータフローを最適化しているため、外陬瓮皀蠅悗離▲セスは最小になっている。また、MMUをオプションで集積すれば、アンドロイドなどのOSにも官できる。

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

図4 PowerVR 2NXを使ったデータフロー レイヤーごとにデータ/_みビット数を変えられる 出Z:Imagination Technologies

このPowerVR 2NX NNAニューラルネットワークのアクセラレータIPコアは、CNNにpった認識処理をuTとするため、IoTビデオモニターをはじめ、サーベイランス(監カメラ)、セキュリティなどのシステムに向く。消J電が小さいという魅はモバイルカメラにも監カメラ機ΔけられることをT味する。

画鞠Ъ韻忙箸CNNでは、デープラーニングライブラリはTensorFlowやCaffeなどが中心であるため、これらをサポートしているが、他のライブラリも要ならばサポートしていくとLongstaffはいう。

(2017/09/26)

ごT見・ご感[
麼嫋岌幃学庁医 亜゛狹゛煤泣゛亜゛喘薦翫絃| 挫虚罎忽恢天胆晩昆窒継鉱心 | 冉巖晩云匯曝屈曝眉曝壓濂賛| 娼瞳匯曝屈曝眉曝膨曝励曝鎗曝| 忽恢寄頭窒継爺爺心| 91撹繁壓濂シ| 爺爺荷爺爺握爺爺孤| 嶄猟忖鳥窒継篇撞| 晩昆窒継壓濆杰簡啼| 冉巖岱鷹触匯触屈触眉| 天胆菜繁videos賞寄18tee| 窒継廨曝某沃重距縮篇撞| 胆溺瓜簾皮析弗俤俤只鮫| 忽恢怜匚爾涙鷹av谷頭| 天胆検薦及匯匈| 忽恢娼瞳闇蝕恂訪訪訪議篇撞| 99篇撞娼瞳畠何壓| 戎曇輝彭厘議中瓜4p将煽| 嶄猟忖鳥冉巖爾秤| 晩云怜匚娼瞳匯云壓濆杰| 消消楳楳課圻冉巖AV涙鷹醍狭| 天胆來弼19p| 冉巖娼瞳www| 蒙雫仔匯雫殴慧| 窒継忽恢寔糞痴j壓濆杰| 胆忽噴肝娼科壓瀛啼| 忽恢匯雫互賠窒継鉱心| 互賠天胆匯曝屈曝眉曝| 忽恢返字娼瞳篇撞| 牽旋篇撞1000| 壓濆杰諌纂驚頭窒継| chinese娼瞳槻揖崗惜弌市| 暫溺free來zozo住| 嶄忽匯雫蒙仔aa谷頭寄頭| 涙鷹富絃匯曝屈曝惜咳AV| 消消消娼瞳繁曇匯曝屈曝眉曝膨 | 晩昆娼瞳匯曝屈曝眉曝析兌倫| 冉巖匯曝嶄猟忖鳥壓澣舐依 | 來諾怎消消消消消消消| 嶄猟忖鳥某沃崙捲| 返字壓瀛啼議禧議|