Arm、モバイルにも~単な收AIを搭載できるサブシステムIPを開発
IntelやAMD、Qualcommまでがパソコン向けのAI機ζ鼎SoCプロセッサを発表し、パソコンにAI機Δこれから入っていく時代になるが、スマートフォンのようなモバイルにもAI機Δ入っていく時代になりそうだ。モバイル半導IPの覇vArmがAI機Δ鯏觝椶任る新IP「Arm Compute Subsystems(CSS)for Client」を発表した。電効率が高いことが最jの長となる。

図1 收AIをモバイルで実現できるArmの新サブシステムIP 出Z:Arm
「Arm CSS for Client」はGPUコアであるImmortalis-G925を中核に、新CPUコアのArm Cortex-X925を2個、性δ_のCortex-A725を4個、消J電_のCortex-A520を2個集積したIPである(図1)。最jの`的は、CPUとGPUをセットにして、クライアントのチップにそのまま実△任るサービスを提供するもので、IPだけではなく開発ツールのKleidiと共に提供する。
H数の積和演Qv路を集積しているGPU(グラフィックプロセッサ)は、ニューラルネットワークのモデルに適したQを提供するk、演QT果データを共~する仕組みが要となる。そこで、Cortex-X925がマルチコアのクラスタをU御しL3キャッシュメモリを共~する仕組みを提供する。マルチコアCPUとしては、性δ_のCortex-A725を4コアと消J電_のCortex-A520を2コア使う。いわば来のbig.LITTLEアーキテクチャにpったCPU群だ。これらのCPUとGPUのImmortalis-G925をU御するのがCortex-X925である。これらのコアは3nmプロセスノードに官した駘設を済ませた量OKのコアとなっている。
ニューラルネットワークのAIモデルでは、H数ある並`動作の積和演Q_でuられたデータをメモリに共~しなければ次のニューラルネットワークレイヤーに行かれない。CPU処理もGPU処理もメモリを共~しなければくなるため、それらを共~するための仕組みがCortex-X925のようだ。
つまりArm CSS for Clientは、AIに化した専のプロセッサというlではなく、メモリを共~するような仕組みをeったサブシステムとなっている。このためAIではなく、セキュリティ\術SVE2エンジンに変換することも可Δ砲覆辰討い。さらに、收AIのようにテキストをトークンという単位に分割する動作にも官できる。ちなみにTiny-Llama(Q4)の小模言語モデルで、最初のトークンまでの時間は来のCortex-X4と比べて41%も]いというAI性Δ魴eつ。いわばAIにもセキュリティv路にも官できるフレキシブルなサブシステムだといえそうだ。
AI応をT識したサブシステムなのにCPUと共~メモリを_したのは、AIチップではワークロードの70%をCPUが担っているためだとArmはいう。
ただし、GPU同士で来と比較しても性Δ蝋發なった。今vの14コアのImmortalis-G925は、12コアの来のImmortalis-G720よりもAI推bが34%高]になった。さらにグラフィック性Δ箸靴討離譽ぅ肇譟璽轡鵐亜Ray Tracing)性Δ52%向屬靴燭箸いΑレイトレーシングは、グラフィックスでWいた絵のに当たる光線を入oからoや壁などでての反oまでQする\術で、^真か絵か区別しにくいほど^実的な絵をWくことができる。しかし、これまではQに長い時間がかかっていた。ArmはこれをほぼリアルタイムでQできる\術を開発したようだ。Nvidiaも2018Qにリアルタイムのレイトレーシング\術を完成させていた。ただし、消J電はArmよりもjきいと[気気譴。
図2 AI向けアプリを開発するためのツールKleidiAI 出Z:Arm
ハードウエアだけではなく、AI向けのアプリケーションソフトウエアを開発するためのツールKleidiでは、AI向けのArm KleidiAIとコンピュータビジョン向けのArm KleidiCVもTした。KleidiAIでは、ArmのCPUに最適化したアプリを作れるだけではなく、收AIフレームワークに最適化した設を可Δ砲垢襦平2)。KleidiCVはコンピュータビジョンのフレームワークに向けた開発ツールである。
今後、ArmはこれまでのようなAndroidに加え、WindowsやLinuxなどにも官していく。Microsoftのソフトウエアにはほぼ官するようになったという。