ニューロチップ説 〜いよいよ半導の出番(5-3)
いよいよ最終章の最後にやってきた。ここでは、今後の動向を中心に紹介する。GoogleやIntelがこれからどの(sh┫)向に向かうのか、どのようなアルゴリズムが出てくるか、さらには半導IC化する場合の消J電はどうなるか、などこれまでのデータを元にこれからの(sh┫)向を議bする。(セミコンポータル集室)
著v:元半導理工学研|センター(STARC)/元東 瀬 啓
5.3 最後に 〜今後の動向と課〜
2016Qでに`立った点は、ビジネスCではIntelとGoogleのハード笋任僚室造IoTおよびEdgeUへの流れである。また\術Cではモバイル化搭載を狙った圧縮\術の実化に向けた動きである。その影xはエッジU/IoT般にS及する。本Iではその現Xの動向をD理し、最後に課を述べる。
現Xと今後の動向
(ア) ビジネス
図53は最ZのGoogle社とIntel社の動きだ。データセンター/サーバでの官はもとより、IoT/エッジUへの流れが]い。
図53 Google社とIntel社の最Zの動向 (Intel社情報は参考@料 113および114を参考に作成)
Googleで`を引くのは、TensorFlowを絡めたGreenWave社(GAP8)へのTPUのIP供給の可性だ。12月のAndroid Thingsのo表(参考@料115、116)も気になる。図54にすようにエッジ笋任亮孫圈癖g実行)への々圓予[以屬]く進むかもしれない。背景には、データセンターの容量の逼があるのかもしれない。2020Qに今の100倍の高]エンジン実現というBも聞くがいのかもしれない。高度なアルゴリズムの成功と実化、ユーザの\加、そしてIoTの成長を考えるに、データセンターのハードのQξ(]度と模)向屬呂發箸茲蝓△いに実行を分gしておくかが成長の鍵となる時代が来たのかもしれない。
Intelの情報は、同社の発表(参考@料113)を元に、日経情報(参考@料114)も加味した。8月以Tの3社(Saffron社/Nervana社/Movidius社)との合(A収)の動きには驚いた。それぞれの会社がここ2Qほど`立っていたからだ。サーバUのt開はもとより、エッジUの啣修見られる。画気uTなMovidius社、また2017QになってA収を表したMobilEyeとどのようにタッグを組むのか今後の動向が気になる。
図54 クラウドからエッジへの実行・学{の分gの要因とステップ
(イ) アルゴリズム
NIPS2016(12月5日バルセロナ)のT果が気になる。6000人が参加したとのことで、r況だったに違いない。この寄Mが出る頃にはいろいろな記や情報が出ていると推Rする。教師無し学{を中心に、教師~り学{に変わる学{、環境より予R(Prediction)する}法等々、にO言語関連がR`である(GNMT含めてJに発表済み?)。言語が~単に扱えるようになると人間とのインターフェースが言に変わり、より身Zになるからだ。リアルタイムで個人向けに人工Δ魄蕕討燭なる。まるでO分の子供のように。
(ウ) LSI\術
繰り返しになるがSRAMオンチップで図55にすように0.1W(以下含め)で1TOPS/Wを越えるj(lu┛)模なディープラーニングの処理が可Δ砲覆辰拭8什澆浪誼羶瓦世、もっと低@度で次元のj(lu┛)きい処理が今後R`されると予[している。
図55 エネルギー効率(エネルギー当たりの演Q性Α砲半嫡J電の関係
図56にすように画鞠Ъ韻任蓮∋@度を落とした実レベルでは、IoEのチップが実証したように、0.05W級のレベルにある(ただし、IoEは情報が少ない点、解圓砲料Tが要)。Squeeze Netでも同レベルと推Rされる。今後、高@度化を狙ったチップが出てくる(ISSCC2017では数Pの1〜10 TOPS/WのLSIの発表があった。図56に代表的なチップKU-Luevenj(lu┛)学のENVISIONを加えた。さらに1PImagenetのエラー率5-10%の高@度を狙うVGGNetを扱うLSIの報告があったが処理]度がすぎる)。さらに時U`処理の実⇔磧蔑磴┐弌▲ラシカルな検}法とRNNを組み合わせた行動予Rがある(参考@料119))もk層表C化してくる (ISSCC2017ではKAISTがCNN+RNNを発表)。
図56 LSI開発の\術トレンド 〜実▲譽戰襪嚢眄Σ修
低消J電に加えて、プログラム(パラメータが_たい)の総容量が100MByteを割ってくるとモバイルへの搭載が進むと言われている。携帯経y(t┓ng)だとiOSでは100MB、アンドロイドだと50MBと言われている(参考@料117、118情報が少し古いが)。またプログラムの書換え(パラメータ(g┛u)新)の頻度と時間もポイントになる。図56にすように10MBを切ってきているので、ソフトウェアベースだがにスマホでの搭載が進むと考える(思った]度は出ないが)。機械翻lにQ社・Q機関がRしているのはかなり良い線まで来ているからだ。100〜200MB位までは来ている。今後の動向は携帯の5GのS及動向とも絡む。
最後に
今後のt開および課を図57にすネットワークの覦茵模:入とパラメータ)(1)〜(4)に分けて説する。(1)と(2)は実行、(3)と(4)は学{に関するものだ。(3)と(4)はほとんどこの寄Mでは詳しく扱わなかった霾である。
図57 LSI実Cから見た今後の(sh┫)向性(CNNUとDNNU)
(1)実行(CNN/パターン認識)〜\術マッピングとフレキシビリティ
(10k〜10Mパラメータ覦茵Э57): CNNUに関しては、CNNをベースとするアルゴリズムの進tとt開が少し気になるが、あるk定の(sh┫)向性(Q込み層の位づけと圧縮\術)が見えてきた。単の認識機Δら複合高機Ε轡好謄燹蔑磴┐弌 CNN→RNN 図8:http://www.589173.com/archive/contribution/applications/160722-neurochip2-1.html)のi処理(i段筺砲竜Δ箸靴胴く使われるばかりでなく、その主構成となるQ込み層が極めてξのある「層」であることからHくの新しい周辺(材認識とか合成・收とか・・・)\術・応覦茲鮴擇螻いてゆくと[定できる。応別(複合機Σ宗Ε轡好謄牴輯泙瓠砲法⊆\術を圧縮\術およびフレキシビリティを軸にマッピングすることがポイントと考える。
(2)実行(DNN/時U`)〜入次元数が鍵、応により圧縮・メモリ/デバイスが_要に!
(1M〜100Mパラメータ覦):DNNU(CNNU)に関しては実行・および学{共に\術革新が要な覦茲任△襦アルゴリズムはもとより、LSI実△菘世ら材料、デバイス、v路\術、およびv路アーキテクチャとがんばりが要だ。代表的なネットワークは時U`処理のRNNと啣蹴{だ。に実△菘世ら、入の次元数にはRTが要だ。符(gu┤)化された情報(例えばNMTだと分g表現、行動推RだとR-CNNをi段にeつ)がRNNの入となっている点だ。ここでも応分野と\術のマッピングが要だ。
(3)学{(DNNU/ある度完璧)〜アルゴリズムが完にwまっていないのか?!
(100M〜1Gパラメータ覦):現在実化されている学{のHくが教師~り学{だ。教師~り学{では、教科書作りが要だ。ビッグデータ(O動運転のためのO路情報とか)になればなるほど気の遠くなるほどの作業が発擇垢襪畔垢い討い襦N磴┐100万の^真を1000クラスに分類するのは実は人間で、人間が「巧み」の\を教科書にまとめ屬欧襦蔽韻覆1000のクラス分けだが)だけでくたくたになる。(余iだがImageNetの人間のエラー率5.1%だってpしい)。教師無し学{が待望されている。AlexNetが出なければもしかしたら教師無し学{が寄りOせずに進化していたかもしれないとも聞く。LSI実△箸いΔ茲蠅發辰岼未離▲襯乾螢坤爐涼奮の課である。不咾覇阿があることは感じているが詳細は掴んでいない。今後動向を瑤要がある課と考えている。
(4)DNNU/学{〜(少しずつ学{)そろそろ動き出しそうな気配がある!
((3)の覦茲茲蟆爾隼廚錣譴):もうkつはある度のリアルタイム性と個別官が可Δ奮{だ。学{当初は間違っていても良いのかもしれない。これも人間の動作にZいことからHくの研|がなされている。より的なCも感じられ魅的な分野である。
峙の(3)と(4)の学{にさらには1章1.6Iで~単に述べた環境の学{(Prediction)を含めて3つの学{のU化(NIPS2016の理解含め)と推進が今後_要になると考える。
a
今vの寄Mにあたり、おmをXけていただいたセミコンポータルのS様、また所錣靴討い榛櫃мqを頂いた旧(株)半導理工学研|センター(STARC:2016Q5月で解g)のS様には感a致します。さらに、情報の基礎となる\術また考え(sh┫)等をご指導・ご教bいただきましたj(lu┛)学・研|機関・企業のS様、にLOj(lu┛)学の浅井哲也教bの暖かいご指導には心より感a致します。
著vのあとがき
当初、1章を書き始めた2016Qの春からにかけての段階ではディープラーニングが適されるアプリケーションに関しLCをより割く予定でしたが、から秋にかけv路関係のまとめに入った段階で予[以屬飽欺牟\術の頭がしく、k定のレベルでまとめた(sh┫)が良いと考えました。個人的な環境の変化もあり、当初より時間がかかってしまいました。アプリケーションに関しては、に(1)と(2)の「実行」ではアプリケーションの探索というより実△離侫А璽困貌ったと考えます。(3)と(4)の「学{」に関しては、逆にアプリケーションの開も並行して今後ますます_要になると考えています。今vは割愛させていただきます(今後何らかの機会があれば紹介したいと思います)。
最後に、1章1.6Iの図5をいて説致しましたが、人工Δ瓦群罅垢考え期待しているレベルのΔ瓦靴董⊇j(lu┛)2〜3合`まで来たというのが個人的な印(j┫)です。今後は、ディープラーニングに匹發垢觸j(lu┛)きな谷がもうkつ二つはあるはずで、その達成のためには材料からデバイス\術含めて半導の寄与すべき点は極めてj(lu┛)きいと考えます。遠く及びませんが(ほんの1合`)、その推進のk\と本寄Mがなればmいと考えている次です。
集R)瀬の現在の肩書は、LOj(lu┛)学 j(lu┛)学院情報科学研|科 学術研|^である。
参考@料 (1〜104まではiv以i)
- IBM Synapse PJT リーダ Dharmendra S Modhaのブログ (2015Q8月17日) IBMの開発X況.
- 電子情報 Quartz, "IBM has built a digital rat brain that could power tomorrow's smartphones", IBMのボード情報, 2015Q8月18日.
- IBM Synapse PJT リーダ Dharmendra S Modhaのブログ (2015Q8月3日), "Brain-inspired Computing Boot Camp Begins", IBMのブートキャンプ.
- Alexander Andreopoulos, Rodrigo Alvarez-Icaza, Andrew S. Cassidy and Myron D. Flickner, "A low-power neurosynaptic implementation of Local Binary Patterns for texture analysis", 2016 International Joint Conference on Neural Networks (IJCNN), 最ZのTrueNorth 低消J関連のb文、2016Q11月2日.
- Caroline Vespi (IBM), "Deep learning inference possible in embedded systems thanks to TrueNorth", IBM Research Blog, September 21, 2016, Posted in: Cognitive Computing, IBM Research-Almaden, IBM 新しい成果のアピール(参考@料44の内容)、2016Q9月21日
- Steven K. Esser +, IBM参考@料44の最終版の発表、Proceedings of the National Academy of Sciences of the United States of America, vol. 113, no. 41、 2016Q10月11日.
- Steven K. Esser +, "Algorithms1/2", 学{のアルゴリズムの詳細、2016Q10月11日にo開.
- 盜 DeepScale社, ホームページ, Squeeze Netの著vのForrest N. Iandolaが所.
- Intel社のIntel Press Kit, "Intel Artificial Intelligence: Unleashing the Next Wave", 20161117, Press Kit Intel社のAI戦Sのプレス発表.
- 日経テクノロジーオンライン, "エッジからクラウドまで曚襦IntelがAI戦Sを発表", 2016Q11月18日、Intel社のAI戦S
- Android Thingのページ; "Build connected devices for a wide variety of consumer, retail, and industrial applications", Google Android Thingsのページ, 2016Q12月13日
- Wayne Piekarsk, "Announcing updates to Google's Internet of Things platform: Android Things and Weave", Google Android Developers Blog, 2016Q12月13日, GoogleのAndroid Things
- アピアリーズTech Blog, "アプリの容量にU限はあるの?", 2015Q6月11日、スマホのアプリ容量のU限.
- ブログ, "Apple、2GBから4GBへiOSアプリの容量峺造鯤(g┛u)!", 2015Q, スマホ容量
- Kyuho J. Lee, Kyeongryeol Bong, Changhyeon Kim, Jaeeun Jang, Hyunki Kim, Jihee Lee, Kyoung-Rog Lee, Gyeonghoon Kim, Hoi-Jun Yoo, "14.2 A 502GOPS and 0.984mW Dual-Mode ADAS SoC with RNN-FIS Engine for Intention Prediction in Automotive Black-Box System", 2016 IEEE International Solid-State Circuits Conference, 14.2 pp.256, 2016Q2月, KAIST RNN/ADAS
- Jun Sawada, Filipp Akopyan, Andrew S. Cassidy, Brian Taba, Michael V. Debole, Pallab Datta, Rodrigo Alvarez-Icaza, Arnon Amir, John V. Arthur, Alexander Andreopoulos, Rathinakumar Appuswamy, Heinz Baier, Davis Barch, David J. Berg, Carmelo di Nolfo, Steven K. Esser, Myron Flickner, Thomas A. Horvath, Bryan L. Jackson, Jeff Kusnitz, Scott Lekuch, Michael Mastro, Timothy Melano, Paul A. Merolla, Steven E. Millman, Tapan K. Nayak, Norm Pass, Hartmut E. Penner, William P. Risk, Kai Schleupen, Benjamin Shaw, Hayley Wu, Brian Giera, Adam T. Moody, Nathan Mundhenk, Brian C. Van Essen, Eric X. Wang, David P. Widemann, Qing Wu, William E. Murphy, Jamie K. Infantolino, James A. Ross, Dale R. Shires, Manuel M. Vindiola, Raju Namburu, and Dharmendra S. Modha, "TrueNorth Ecosystem for Brain-Inspired Computing: Scalable Systems, Software, and Applications", SC16, Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis Article No. 12, 2016Q11月13日, IBMのTrueNorth動(EcoSystem)