精品亚洲一区二区,国内精品久久久久激情影院,在线免费观看视频你懂的

ニュ〖ロチップ車?yán)狻　沥い瑜い枞酒硵仱谓腥?4-2)

2017年4月 5日 ∶大蠱∈染瞥攣炳脫∷

ニュ〖ロチップの洛山毋として、∈4-2∷ではDNN∈ディ〖プニュ〖ラルネットワ〖ク∷の倡券2毋を疽拆する。面柜彩池薄のDaDianNaoチップと、躥柜KAISTのDL/DI∈Deep Learning/Deep Inference∷チップを疽拆している。∈セミコンポ〖タル試礁技∷

螟莢¨傅染瞥攣妄供池甫墊センタ〖∈STARC∷/傅澎記　紗昆　芳

4.2　洛山弄チップ∈DNN脫チップ∷×DRAM寒很もしくは池漿怠墻
塑淚では、豆盜のDNN∈潤C(jī)NN∷脫のチップの棱湯をする。鏈馮圭霖肩攣の菇喇を前片に、池漿怠墻を敷ね灑えたチップである。しかし攙烯菇喇まで拒しく淡揭した毋は警ない。塑鞠ではCAS∈面柜彩池薄∷のDaDianNaoとKAISTのDL/DI∈Deep Learning/Deep Inference∷の2チップを棱湯する。漣莢は2014鉗12奉のMicro47で、稿莢は2015鉗2奉のISSCC2015で券山された。鼎にフルペ〖パ〖の俠矢∈徊雇獲瘟37, 86∷が叫された。

DaDianNaoは、橙磨拉を積つオ〖ルマイティ〖なス〖パ〖チップである。Dl/DIはDBNのネットワ〖クモデルに決哈み霖の妥燎を掐れたものでいわゆるCDBN∈Convolutional Deep Brief Network∷灤炳のチップである。すなわちRBMによる池漿を艱り掐れた塑呈弄な漓脫チップである爬に廟謄して瓦しい。なお、鏈馮圭のモデルであるRNNとRL(Reinforcement Learning¨動步池漿)に簇しては充唉した。

(1)DaDianNao (CAS) × A Machine-Learning Supercomputer
このチップは、2014鉗瑣のMicro47∈The 47th International Symposium on Microarchitecture)でBest Paper Awardを減巨したチップ(CAD悸劉まで)である∈徊雇獲瘟37∷。タイトルに∩A Machine-Learning Supercomputer∩と燒けられているように驕丸のGPUの拉墻を廬刨で50×100擒、エネルギ〖跟唯で1000擒鎳刨猖簾したものであった。1鉗染笆懼沸つが、ワンチップとして悸劑の廬刨で、5.6 TOPS (Tera Operations Per Second)の拉墻を肛っている∈稿揭するEIEが、暗教禱窖を脫い悸跟拉墻でDaDianNaoを懼?jǐn)vっている¨山6∷。鼎票螟莢の施Inria∈フランス柜惟攫鼠池極瓢擴(kuò)告甫墊疥∷の禱窖莢をリ〖ダとして痙き倡券を夸渴した。2014鉗瑣の碰箕も附哼も池漿の箕粗をいかに沒教∈遍換の光廬步∷するかが凳鈍の草瑪であったことから、∈AlexNetの池漿の毋もあるが、碰箕は部であれ池漿に1降粗はかかると咐われていた∷アルゴリズムの甫墊莢やアプリケ〖ションサイドの數(shù)との柴廈でよく廈瑪に懼り、かつ袋略の絡(luò)きかったチップであった。

哭31　DaDianNao(CAS)の車妥慌屯 ∈徊雇獲瘟37を徊雇に侯喇∷

哭31　DaDianNao(CAS)の車妥慌屯 ∈徊雇獲瘟37を徊雇に侯喇∷

∈ア∷チップ菇喇
俠矢は、CNN/DNNなりAlexNet霹ネットワ〖クモデルの夢急がないと粕みづらいが、LSIもしくはDRAM寒很チップとしてみるならば柒推は帽姐だ。メモリの呈羌は、嘲から掐ってくる掐蝸ˇ叫蝸バッファ脫、および腳み∈シナプス猛∷の呈羌はDRAM寒很で、そして面粗デ〖タの辦箕呈羌はSRAMで乖っている。哭31の焊懼の哭が芹彌だ。32MBを腳みに、掐叫蝸バッファ脫に4MBを充り慷った。漣莢はタイル覺の16ヵ疥に芹彌され、稿莢は面看に芹彌された。件收煌數(shù)にHyper Transportの奶慨脫インタ〖フェ〖スを芹彌した。ファウンダリとしてSTMicroelectronicsの28nmプロセスを鱗年している。チップサイズは、8.2mm逞だ。

チップの面看のバッファとタイルとは、呂ったトポロジ〖∈Fat Tree菇喇(16ビット)∷で奶慨を乖っている。その辦つのタイル∈Tile¨焊布)は、4改のeDRAMのバンクに尸かれる。バンド升は4,096ビット/バンクとかなり絡(luò)きい。タイルの面看にNFU∈Neural Function Unit∷を銅する。バンクから腳み∈シナプス猛∷を粕み哈み、焊から掐る掐蝸デ〖タとで遍換借妄をNFUが乖う。寶布にNFU柒嬸菇喇を績した。ピンク俐が掐蝸デ〖タ∈掐蝸潑魔マップもしくは掐蝸イメ〖ジ∷、濫俐が叫蝸デ〖タ∈叫蝸潑魔マップ∷を、さらに樂俐が腳み∈シナプス猛∷の萎れを績す。

∈イ∷NFU (Neural Function Unit)
16掐蝸∈16ニュ〖ロン∷および16叫蝸∈16ニュ〖ロン∷が票箕に胺える。樂い甜磅は、シナプス猛∈腳み∷の粕み哈みパスである。稱ブロックは、姥、下、賴憚步簇眶/寵拉步簇眶借妄∈Transfer簇眶∷、叫蝸、面粗猛バイパス借妄∈そのために漣揭したように8KBのSRAMを柒壟∷を減け積つ。

16x16=256シナプス∈腳み∷がアクセス材墻である。256改のMAC借妄が事乖で票箕に乖える。256 MAC∵2 ∵16Tile∵0.606 GHz = 5.0 TOPSの借妄墻蝸を銅する(悸狠はもう32 MAC尸遍換が材墻で5.6 TOPS)。池漿箕にはセレクタで攫鼠のパスを浩菇喇しフェ〖ズの恃構(gòu)に灤炳する。フィ〖ドバック猛∈gradient∷を掐蝸するパス、また腮拇臘稿のシナプス猛∈Updated Synapse∷をe-DRAMに呈羌するパスを浩菇喇する。

∈ウ∷コンフィギュラビリティ ∈浩菇喇∷
哭32に霖、およびフェ〖ズ∈池漿と悸乖∷の磊り侖えの萎れを績した。俠矢を徊雇に驢警夸盧を掐れて侯喇した。哭31の寶布哭のNFU(Neuron Function Unit)のパイプラインのステ〖ジ∈Stage 1/2/3∷を磊り侖えることにより、決哈み霖/鏈馮圭霖/プ〖リング霖/賴憚步簇眶あるいは寵拉步簇眶の稱借妄を浩菇喇する。もちろん、シナプスの掐蝸の銅痰も簇息する。プ〖リング霖ならシナプスの掐蝸は稍妥だ。ネットワ〖クの借妄が渴み、霖が恃わる∈毋えば決哈み霖からプ〖リング霖∷タイミングでダイナミックに磊り侖える。また悸乖モ〖ドから池漿モ〖ドも票屯に磊り侖えるが、漣揭したシナプスのアップデ〖トのパスも菇蜜する澀妥がある。界帕橋∈Forward Propagation∷と嫡帕橋∈Backward Propagation∷の磊侖えにより池漿を乖う擴(kuò)腆ボルツマンマシン∈RBM¨Restricted Boltzmann Machine)の緘恕を脫いた池漿の淡揭が銅り努脫している滔屯だ∈拒嘿の棱湯はない∷。

哭32 浩菇喇の磊り侖えの萎れの車維哭 ∈徊雇獲瘟37を徊雇に侯喇∷

哭32 浩菇喇の磊り侖えの萎れの車維哭　∈徊雇獲瘟37を徊雇に侯喇∷

∈エ∷馮蔡¨拉墻
久銳排蝸¨哭33にシミュレ〖ションによる久銳排蝸の尸邵を績した。チップ鏈攣で16Wと活換されている。そのうちチップ粗奶慨を乖う光拉墻帕流攙烯∈HT¨Hyper Transport、Point to Point及の繞脫儡魯禱窖∷の久銳排蝸が染尸を貍めた。螟莢らも揭べているが海稿供勺が澀妥な艙疥だ。なお、塑チップはサ〖バ脫なので、驢チップでの鷗倡を渾填に掐れることが澀寇だ。春えて帽攣での蝗脫を前片に彌くと∈毋えばエッジ廢炳脫∷、鏈攣としては10W疤の久銳排蝸とみなせ、柒嬸RAMアクセスに6Wを妥している。柒壟とはいえ、DRAMでは久銳排蝸がやはり絡(luò)きい。

哭33　DaDianNaoの久銳排蝸尸老とスケ〖ラビリティ孺秤∈徊雇獲瘟37を徊雇に侯喇∷　叫諾傅¨STARCの拇漢鼠桂今より啪很

哭33　DaDianNaoの久銳排蝸尸老とスケ〖ラビリティ孺秤　∈徊雇獲瘟37を徊雇に侯喇∷
叫諾傅¨STARCの拇漢鼠桂今より啪很

スピ〖ド¨哭33に俠矢のデ〖タを徊雇に侯喇したスピ〖ドのデ〖タを績した。僥即はNVIDIAのGPU K20Mとの陵灤スピ〖ド孺だ。玻即は事誤瓢侯させた眶∈スケ〖ラビリティ〖∷だ。チップを籠やす髓に拉墻がスケ〖ルアップするか∈木俐が司ましい∷を冉們できる。いくつもの俐があるが、決哈み霖(CONV霖)、プ〖リング霖∈Pool霖∷霹のスケ〖リング拉墻を績した。鏈攣に1チップで10×100擒の光廬拉を績している。スピ〖ドCONV霖とCLASS霖∈鏈馮圭霖∷で瘋まることからその面粗猛とみて、ワンチップの眷圭には60擒鎳刨の猖簾が斧られる。

GPU K20Mの慌屯デ〖タとDaDianNaoの攙烯菇喇からスピ〖ド拉墻孺秤を詞帽に活換した。メモリバンド升とMACの眶を帽姐に齒けたもので孺秤すると、DaDianNaoは44擒の拉墻が帽攣∈ワンチップ∷で叫ることがわかる。DaDianNaoとK20Mとの惡攣弄な眶猛を績すと、バンド升が5TB/s灤、208GB/sで24擒、MAC眶が9k改灤5k改で1.8擒となり、尉數(shù)を齒け圭わせると腆44擒だ。刪擦猛とほとんど恃わらない。

ポイントはスケ〖ラビリティだがCONV霖はほぼ木俐だ∈箋闖皖ちるのは掐蝸マップの件收の借妄の逼讀が叫る∷。腳妥なのは鏈馮圭のCLASS霖だが、さすがのDaDianNaoでも16チップ笆懼で拉墻が昔步している。CONV霖だと迫惟しているので尸芹による礙逼讀は井さい。とはいえ、CONV霖とCLASS霖の士堆で斧ると16チップから64チップの粗疤まではスケ〖ラビリティがあり、その孺唯は800擒鎳刨の光廬步が斧哈める∈灤K20Mひとつとの孺秤である爬廟罷が澀妥だが、碰臉GPUのスケ〖ラビリティは端めて你いはずだ∷。

戮チップとの孺秤¨Eyrissとの孺秤をする。山6で、燙姥跟唯(GOPS/mm2)とデザインル〖ルと件僑眶を事べると、DaDianNao (82.7 GOPS/mm2, 28nm, 606MHz) vs Eyriss (6.23 GOPS/mm2, 65nm, 200MHz)となる。EyrissをDaDianNao事みにすると、102 GOPS/mm2となる。IoEでも票屯である。Eyeriss/IoEが決哈み霖脫のチップであることから、DaDianNao/DRAM寒很がメモリアクセス圍廬の鏈馮圭もしくは池漿脫のチップとして介めて潑魔が叫ることを猖めて千急できる。

(2)DL/DI (Deep Learning/Deep Inference) (KAIST)×DBNを塑呈悸劉
2015鉗のISSCCで躥柜KAISTより券山された∈徊雇獲瘟86∷。兜徽痰し池漿が材墻なチップだ。DaDianNaoと佰なり池漿と悸乖の稱」の攙烯を積つ。DL/DIの鈣疚は僧莢が俠矢のタイトルより艱った。DaDianNaoがサ〖バを肩タ〖ゲットとしたのに灤し、DL/DIはフロントエンド∈エッジ∷もしくはニアエンド∈フォグサイト∷をタ〖ゲットとしている。券山ではクラウド婁のデ〖タ呈羌/奶慨の砷么猴負(fù)のためにニアエンドに池漿怠墻を積たせる爬に腳きをおいて怪遍を乖っているが、ほぼ1鉗稿のフルペ〖パ〖では、モバイルでの池漿怠墻烹很までタ〖ゲットを弓げて俠矢を菇喇している。0.2W鎳刨で、エネルギ〖跟唯は1.93 TOPSとかなり光いことから努脫認(rèn)跋は弓い。

∈ア∷池漿怠墻ˇˇˇ兜徽痰し池漿
哭34に俠矢を徊雇に侯喇したチップのブロック菇喇を績した。悸乖エンジン∈Deep Inference Engine∷と、池漿エンジン∈Deep Learning Engine∷、さらにはグロ〖バルな宛眶券欄攙烯¨TRNG (True Random Number Generator) の3つの菇喇からなる。池漿エンジンは4つのコア∈DLコア∷からなる。拒嘿な棱湯は充唉するが、4つのステ〖ジからなるパイプライン菇喇となっている。かつポジティブとネガティブの企腳スレッド數(shù)及を何脫している。DBN (Deep Neural Network¨徊雇獲瘟78, 80) におけるRBM (Restricted Boltzmann Machine 76,77) でのNegative/Positive數(shù)羹の池漿緘界を跟唯よく悸附すべく菇喇されているとみている。

哭34 DL/DIの車妥慌屯 (徊雇矢弗86を徊雇に侯喇)

哭34 DL/DIの車妥慌屯　(徊雇矢弗86を徊雇に侯喇)

∈イ∷宛眶券欄達(dá)およびその丁惦システム∈ネットワ〖ク∷
哭34に績したように、池漿∈DL∷および悸乖∈DI∷に澀妥な宛眶券欄達(dá)は遍換エンジンに灤して、改」に積つ數(shù)及ではなく燙姥跟唯の紊いグロ〖バル∈Global∷な數(shù)及を何脫∈哭のTRNG∷した爬が鏈攣ア〖キテクチャの絡(luò)きなポイントであると揉らは肩磨した。デ〖タが泰礁することを松ぐために、宛眶の芹慨と池漿/悸乖のデ〖タ流慨のパスを窗鏈に迫惟させるア〖キテクチャがその柒推だ。

∈ウ∷馮蔡¨拉墻
揉らはCDBN (Convolutional Deep Brief Network:徊雇獲瘟80)ネットモデルでの兜徽痰し池漿を32∵32 RGB 緘妨覺の千急に努脫した。LSIとしての拉墻を哭34の山に績した。池漿でのピ〖ク拉墻は328.3 GOPSとかなり光い。その馮蔡として1.93 TOPS/Wというこれも光いエネルギ〖跟唯猛を謾き叫している。孺秤をする鼠桂がほかに驢くないこと、また俠矢で拉墻に簇して繪燙を驢く充いていないことから1.93 TOPS/Wの紊し礙しを冉們するのは豈しいが、かなりの拉墻には斧える。なお、悸乖∈DI¨Deep Inference∷では3.1淚で揭べた事誤借妄に裁えて、タスクレベル、霖∈Layer∷レベルでの事誤借妄を裁えて光廬步した。

試礁廟∷紗昆會の附哼の釜今は、頌長蘋絡(luò)池絡(luò)池薄攫鼠彩池甫墊彩池窖甫墊鎊である。

ご罷斧ˇご炊鱗

ニュ〖ロチップ車?yán)狻　沥い瑜い枞酒硵仱谓腥?4-2)

Breaking News

2025鉗2奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

ニュ〖ロチップ車?yán)狻 沥い瑜い枞酒硵仱谓腥?4-2)

Breaking News

2025鉗2奉のトップ10淡禍

キ〖ワ〖ド

インサイダ〖ズ

ニュ〖ロチップ車?yán)狻　沥い瑜い枞酒硵仱谓腥?4-2)