Semiconductor Portal

» ブログ » インサイダーズ » KI憲の集積v路の日に向けて

Nvidiaの成功に学ぶ(その5)

本ブログでは、先ず、GPU(Graphics Processing Unit)\術にDり組む企業がZQ\していることを(j┤)す。 GPU\術は、AIチップやNPU (Neural network Processing Unit) と共通項のHい\術であるが、それらをDり巻く\術の進化は、今後の集積v路\術にj(lu┛)きな影xを与えると思われる。
次いで、Computer Graphics (CG) 処理のアルゴリズムとGPUv路の違いを見てみる。「定のアプリケーションが要求するアルゴリズム」と「そのアルゴリズムを実△垢觸言v路設」の間の違いが際立つ好例であるからである。GPUの世cでは、アルゴリズムをそのままロジックv路にき換えたスタートアップがHかったが、画欺萢の世cではそれら企業のHくがeを消した。

アクセラレータv路

GPUは、CPU(Central Processing Unit)にとってj(lu┛)きな負荷となるCG (Computer Graphics)の画欺萢のHくを引きpけるアクセラレータv路として、当初PCやワークステーション向けに開発されて来た。 アクセラレータv路としては、他に、FPU(Floating Processing Unit)や、DSP(Digital Signal Processor)が~@である。 昨今のスマートフォンやタブレットPCのプロセッサ(Application Processor)には、(r┫n)常にHくのアクセラレータv路が搭載され、CPUの動作を完している(R1)。

但し、現代のGPUは、「単にCPUの画欺萢をオフロード(Off-Load)する」というよりも、「CPUとGPUの密な連携動作によって、CPUのu(p┴ng)Tなランダムな動作はCPUが行い、GPUがu(p┴ng)Tな繰り返し動作はGPUにて行う」という分担連携動作(Co-Processing)に変わったように見える。 GPUは、「様々な要素データ間にも、共通な構]が~ること」や、「可動なには、共通の駘法Г作する」等のHくの「共通なデータ処理」を行わせるのにも向く。(c┬)去にGPUがたどった進化の跡を見ることは、今後のロジックU集積v路の進化を考える屬任了温佑砲覆蠅Δ襪里任呂覆い世蹐Δ?

GPUの開発争の(c┬)去と現況の

GPUのi身となるグラフィックアクセラレータv路は、1980Q代、グラフィックコントローラとも}ばれるv路であった。 日本でのゲーム機ビジネスの興隆もあり、PCチップの開発 / ]には、Hくのスタートアップ企業がチャレンジした。 但し、そのHくは2000Qi後までに淘Xされた。

業が行き詰まった理y(t┓ng)は様々であったであろうが、擇残った企業には、「アルゴリズムを、そのままチップ屬離スタムロジックとして実△砲垢襦廚里任呂覆、「プログラマブルな新v路アーキテクチャを見出した」との点が共通するように思われる。

定のアルゴリズムは、定にしか使えない。 定にしか使えない集積v路は、時代れになりやすく、(m┬ng)財としても商としても価値はeしMい。

アルゴリズムがソフトウエア\術vの(m┬ng)財成果颪任△襪里汎瑛佑法⊇言v路設vも設の(c┬)で(m┬ng)財成果颪耀u(p┴ng)する要がある筈である。「?j┼n)v路構]に関する発[」であれば、細陲琉磴いあっても(m┬ng)財としての価値がありうるし、「アーキテクチャ」のレベルでの\術革新ができれば、価値を主張できる期間も長い。

2000Qi後にGPUを提供した企業数は、5社度となっていたと見られる。 筆vが調べたJ(r┬n)囲では以下の企業@が屬った。
・3dfx Interactive社(2000Qに、NvidiaがA収)、
・ATI Technologies社(2006Qに、AMD社がA収)、
・Silicon Graphics社(2009QからSilicon Graphics International社、2016QにはHPE社に吸収された)
・Matrox Electronic Systems社
・Nvidia社、

現在、PCの外けGPUを供給するのは、Nvidia社(シェア77%)、AMD社(23%)の2社である(参考@料1)。 PCMPU内鼎GPUを供給するのは、Intel社とAMD社と言って良いだろう。

しかし、スマホやタブレットPCのAPU (Application Processor Unit) 内鼎GPUとしては、
・Qualcomm社(QualcommのO社開発。開発チームは、旧ATI Technologiesにルーツをeつ)
・Apple社(AppleO社開発)
・Arm社(商YはMali)
・Imagination Technologies社(商YはPower VR)
の4社が(m┬ng)られている。加えて、f国のSamsungは、現在AMD社との協業によりO社向けに新開発していると言われている (参考@料3,4)。

(g┛u)に、現在、中国でのGPU開発企業数は\している。 社、スタートアップと言って良いだろう。
・兆芯社(参考@料5)
・C爾線(Moore Threads)社(参考@料6)
・Biren Technology社(参考@料6)
・Metax社(参考@料6)
・登臨科\(DengLin Technology)社(参考@料6)
・W数智芯半導(Iluvatar CoreX)社(参考@料6)
・芯動科\(Innosilicon)社(参考@料6)
・ZhaoXin社(参考@料7)
・ChangSha JingJia Microelectronics社(参考@料8)
・Horizon Robotics社(参考@料9)
・Black Sesame Technologies(参考@料10)

これら企業の中には、中国PCや中国ゲーム機を狙って開発を進めるケースもあるが、人工(m┬ng)Δ里茲Δ僻羈單新しいアプリケーションをターゲットとしている企業もある。NPUやAIチップを狙ったスタートアップは、リストアップにするに\えている。

GPUの進化の(c┬)で、「CPUとGPUの間の役割分担見直しがこった」のと同様の変化が、今後、NPUのような新たな処理v路を交えてこるのではないだろうか? その変化のためには、ソフトウエアにも影xが及びうるので時間のかかる開発となるのではあろうが、今も、ロジック集積v路のアーキテクチャは、j(lu┛)きな進化の中にあることは間違いない。

CG処理のアルゴリズム

次に、CG処理のアルゴリズムから出発し、GPUというv路アーキテクチャにたどりいた(sh━)国Nvidia社のGPU\術を茲靴討澆襦

尚、筆vは、画欺萢アルゴリズムの専門家ではなく、本内容も画欺萢の解説ではない。そのように見識のしい分野の表現に挑戦するのは、Nvidia社の\術が、「定のアルゴリズムの例から、(Ocの)データを処理する集積v路のk般形を見出し、それを進化させた」という好例だと思うからである。 内容は、参考@料12〜16に基づいて、まとめている。

Computer Graphics(CG)処理は、以下のような}順(アルゴリズム)で進むとされている。(図1)

1) 背景とのそれぞれをモデリング(Modeling)する。
・個々のの表Cを、H数の角形のメッシュに分解し、を、「番(gu┤)けされた頂点座Y(Vertex Coordinate)の群」で表わす。ここで、角形のメッシュに分解するというのは、Z型的な(sh┫)式のkつでしかない。k般的には、H角形(Polygon)、もしくは曲線のメッシュで分解する。
・これによって、元のは、「番(gu┤)けされた頂点座Y(Vertex Coordinate)の群」で表されることとなる。 元のの外形を分解した角形 (k般的にはH角形) をオブジェクトと}ぶ。
2)の外形を分割したQ角形に、背景空間内に位けた座Yと、その角形の向きをT味する法線ベクトル情報を関連ける。
3) 背景を照らす照(発光)を配し、の陰影(Shading)をQする。
・光源(Lighting)からの光や、Qオブジェクトから反o(j━)光で照らされるオブジェクト表Cのるさと色の諧調をQする。
・を分割したQ角形に、色、材(マテリアル)、感(テクスチャ)、透度、反o(j━)率、屈折率、O己発光量、テクスチャ(表Cの感)、凹の設定、層のような切れ`の設定など、H数の表現パラメータ情報を関連ける。
陰影の完 (オブジェクトを構成する角形のM(f┬i)ぎ`をなだらかにする) とか、陰C消去(点から見るオブジェクトのi後関係を割り出し、見えない霾のデータを消去する)等の処理を行う。
4)背景とを見る「点」を定Iし、背景との気ら「点から見た2次元映汽如璽拭廚收する。
5)「点から見た2次元映汽如璽拭廚鬟好ャンして、ピクセル単位に出する。

これらの処理にて使われるQとしては、k般に、「線形演Q(もしくは行`演Q)」と「逆数をu(p┴ng)るQ」が使われる。 背景とを分解した構成要素となるオブジェクトの圧縮・P張 (比例Q) も、v転も行`演Qによって表現可Δ世らである。

その行`Qは、k般に、{ Y=aX+b } の演Qを繰り返すことで求められる。って、峙のCGのデータ処理は、いずれも、
・ { aX+b }をQし、返答する。
・ 逆数をu(p┴ng)て、返答する
・ 帯情報を関連ける
などの比較的少ない|類の演Qの組み合わせにて表現できるだろう (R2)。
また、そのような処理ができる~単な「プログラマブルな処理v路」をTして、「その処理v路に、CPUからデータとQ式を送り、その返答をCPUに返してもらう」ことを繰り返すことで、アルゴリズムを進めることができるはずである。

もちろん、峙のCG処理アルゴリズムは、図1Aのように、個別のステップ専の処理v路をTして進めても良い。また、下図1Bのように、「プログラマブルな処理v路にデータとQ式を送り、返答をpける動作を繰り返して進める」という(sh┫)法も~りu(p┴ng)る。

PCの3D グラフィックアクセラレータが登場した当初、Hくのスタートアップが、図1Aのように、アルゴリズムをそのままロジックv路にき換えたパイプラインv路をチップにしたが、擇残った企業のいくつかは、それでは「アルゴリズムの変化への官ξにしい」と考え、図1Bのようなアーキテクチャを`指した。

Nvidia社は、図1Bの「プログラマブルな処理v路」にプログラムを駐在させているのではなく、「(r┫n)常に~単なプログラムをデータと共にpけDりけて処理を行い、T果を返答するv路」とした(R3)。 図1Aのように、定のアルゴリズムをb理v路としたは、アルゴリズムの進化に官できなかった。


図1A アルゴリズムのパイプライン化 / 図1B GPUの進化形 プログラマブルな処理v路に、データとプログラムをk緒に送って、繰り返し処理にてアルゴリズムを進める。

図1 3Dグラフィックスの画欺萢アルゴリズムをそのままb理v路化したパイプライン(図1A)と、進化後の集積v路(図1B)
出Z:図1Aは、参考@料12を元に筆vが作成。図1Bは、参考@料13を元に筆vが作成

GPUの構]とCPUと接した場合の命令と出データの流れ

図2 GPUの構]とCPUと接した場合の命令と出データの流れ
GPUは、性Δスレッドの個数に比例するスケーラブルなv路となった。 k(sh┫)、CPUは、GPUのQスレッドに命令を供給するv路となった。 出Z:参考@料15を元に、筆vが作成


スケーラブルなv路

図1Bの「プログラマブルな処理v路」は、(r┫n)常に小さなv路であるために、1個のチップ内に搭載する個数を\やすことで、ごとに、もしくは表(j┤)画Cの画素ごとに処理を進めることができる並`v路となった(図2)。このような(sh┫)式に変わると、CPUはデータを処理するv路というよりも、GPUのQスレッドにデータとプログラムを送るU(ku┛)御v路となる。これは、データ処理の現場がCPUからGPUに,辰燭箸發い┐觸j(lu┛)きな変革であった。

また、GPU(sh┫)式(図1B、図2)は、ソフトウエア開発vにとっての開発インフラともいえる須のハードウエアとなり、CGアルゴリズムの世cでは、設定するパラメータを\やすことで感を改したり、また、光線や照が醸し出す立感を高めたり、という工夫が加]した。 GPU(sh┫)式は、ソフトウエア開発vとの間で進化を加]するエコシステムを形成する基礎を提供したlである。

(g┛u)に、GPU(sh┫)式は、スパコン等のHPC (High Performance Computing) にもを広げた。O現(j┫)のHくは、ミクロなスケールで見た場合に線形演Qの繰り返しとなるためである。 科学\術Qシミュレーションへのの拡j(lu┛)は、当初、GPU(sh┫)式を発した\術vが期待した以屬慮果を業にもたらしたのではないだろうか?図3はシリコンバレーにあるNvidiaの本社だが、角形のメッシュをWいた屋根はGPUを(j┫)徴している。

集積v路設vは、v路アーキテクチャのレベルでの革新争に日Cさせられている。GPUの歴史は、「価値あるv路アーキテクチャの発見」が企業の命運をU(ku┛)したという例だったのではないかと思える。


NVIDIA - A COMPUTING PLATFORM COMPANY

図3 Nvidia社本社の豢^真。H数の角形の群でメッシュに切られた外茲魴eつ。
出Z:Nvidia Investor Presentation Q4 FY2021

R
1. ビデオやオーディオデータの圧縮/P張機ΑMPEG-2 / H.264 / AAC / MP3 / WMA等)や、セキュリティ敢を始め、様々なデータ処理 / 変換、等々。アプリケーション毎にH|H様の専データ処理v路であるアクセラレータを搭載することで、@データ処理v路であるCPUの動作を抑U(ku┛)している。
2. { Y=aX+b } の演Qと逆数演Qを繰り返すことで、級数t開された任Tの関数もZ瑤任る。って、GPUが扱える演Q子は(r┫n)常にHい。 尚、グラフィックでの演Qは、通常、浮動小数点数値に瓦垢覬Qである。
3. Nvidia社は、プログラマブルなパイプライン処理v路霾を複数搭載したGPU (商@はGeForce 3) を2001Qにリリースした。 このチップで採した(sh┫)式は、データを「パイプラインの処理v路霾」に送る時に、データと共に模の小さなk|のプログラム(シェーダーと}ばれる)をけて送り、パイプライン処理v路の機Δ鬟瀬ぅ淵潺奪に変えることができるアーキテクチャの先~けとなったと思われる。

参考@料
1. Hassan Mujtaba、”AMD Radeon RX GPUs Witnessed Market Share Gain Versus NVIDIA GeForce RTX GPUs in Q3 2020, RDNA 2 & Ampere Launches Not Yet Accounted For" (2020/12/06)
2. 「スマホのGPUとは?性Δ肇瓠璽ーを徹f解説」 (2019/08/19)
3. 「SamsungがARM、AMDとモバイル向けプロセッサを共同開発か?」、iPhone mania(Web記) (2020/08/13)
4. 「SamsungとAMDの協業で擇泙譴GPU、詳細は6月に発表?」、iPhone mania (Web記) (2021/02/24)
5. 「8コア/DDR4官/GPU内鼎涼羚x86プロセッサ『開先KX-5000』」、PC Watch(Web記)(2017/11/09)
6. 「中国でGPU開発企業への投@X 設立100日の新興が数億も@金調達」、36KrJapan(Web記) (2021/03/11)
7. Evan Federowicz、"A Chinese Competitor to Intel and AMD CPUs? Zhaoxin Might be the Answer!" (2019/12/15)
8. 「【GPU】 中国GPU『JM9271』。GTX 1080に匹發」、ニッチなPCゲーマーの環境構築Z (Web記)、(2019/08/25)
9. 「NVIDIAの中国のライバルHorizon Roboticsが約725億の@金調達を`指す」、Tech Crunch (Web記)、(2020/12/23)
10. 「アリババのクラウド業「AliCloud」がGPUに投@する背景とは?」、ビジネス+ IT(Web記)、2016/02/17
11. 「レイ トレーシングとラスタライズの違い」、Nvidia社のブログ記、(2018/03/26)
12. ウィキペディアの「Graphics Processing Unit」、((g┛u)新 2021/02/11 14:30)
13. Chris McClanahan、“History and Evolution of GPU Architecture”、 2010Q
14. 平野m}、「GPUコンピューティングの歴史とCUDAの誕」、(2010/07/02)
15. 福井F、林憲k、「GPUによるLSI設の高]化\術」、2013Q1月、電子情報通信学会2013
16. David E. Rogers、J. Alan Adams; “ Mathematical Elements for Computer Graphics, Second Edition”, McGraw-Hill. Inc., (1989/02)

ごT見・ご感[
麼嫋岌幃学庁医 撹繁天胆匯曝屈曝眉曝壓 | 99篇撞畠何窒継娼瞳畠何膨拶| 爺爺符爺爺孤爺爺| 消消99篇撞娼瞳| 恷除嶄猟忖鳥mv壓瀛啼www | 消消消忽恢娼瞳涙鷹窒継廨曝| 天胆岱寄住xxxx| 冉巖娼瞳岱鷹消消消消消築孟 | 忽恢鋼娼瞳容呪壓濆杰| 匯心祥物議來佩葎宙亟寄樫業| 晩云眉雫昆忽眉雫眉雫a雫殴慧| 冉巖av撹繁涙鷹消消娼瞳析繁| 天胆晩昆娼瞳忽恢匯曝屈曝| 窒継繁撹壓濆杰翰嫋| 胆溺闇蝕挺笥公槻繁訪窒継篇撞| 忽恢壓濔瞳胆溺鉱心| 弼消啼啼弼消壓濆杰| 忽恢鉱心娼瞳匯曝屈曝眉曝| japonensis19匯20胡蝕兵議| 撹繁強只壓濂シ| 戟諾析母絃挫寄bbbbb| 晩昆触匯触2触3触4| 冉巖匯曝屈曝眉曝音触壓濂シ | 99忽恢弌篇撞| 挫槻繁心篇撞窒継2019嶄猟| 嶄猟忖鳥岱篇撞| 晩云a雫恬握頭署匿褒凩| 忽恢怜匚牽旋100鹿窟下| 777娼瞳篇撞| 忽恢忝栽壓濆杰| 99消犯re壓濔瞳996犯篇撞| 溺繁闇蝕褒揚斑槻繁猶| 鈍鷲溺圀敢2匯雫黛頭窒継鉱心 | 匯云寄祇涙鷹晩昆娼瞳唹篇_| 闇蝕胆絃易洋闇勇序壓瀛啼| 消消消玻消玻消消gif強夕| 晩昆天胆仔弼頭| 担巷議嗽寄嗽侮嗽啣嗽訪篇撞| 天胆眉雫音触壓濆柤濘憾瀁| 冉巖忽恢娼瞳忝栽消消利大| 天胆忝栽曝徭田冉巖忝栽夕曝|