AIの中心にあるエネルギー危機

人工知能の急速な成長により、ますます無視できなくなったエネルギー消費問題が生じました。大規模言語モデルのトレーニングは膨大な計算リソースを必要としていますが、より広範な課題は推論です。つまり、本番環境でAIモデルを実行してクエリに応答したり、画像を分析したり、センサーデータを処理したりすることは、規模が大きいほどトレーニングよりも総エネルギーを消費します。データセンター運営者とデバイス製造業者は、現在のエネルギーコストのごく一部でAIパフォーマンスを提供できるコンピューティング・アーキテクチャを見つけるために、高まる圧力に直面しています。

科学者チームは、生物学的神経回路のスパイクベース、イベント駆動情報処理を模倣するように設計された神経形態チップが、従来のグラフィックス処理ユニットまたはアプリケーション固有のAI加速器と比較して70%低いエネルギー消費でAI推論ワークロードを実行できることを示す結果を発表しました。この結果は、神経形態コンピューティングを主に理論的提案からAIハードウェア展開に直接関連する実証済みのエンジニアリング機能へと進めます。

神経形態コンピューティングの異なる点

従来のコンピューティングは、メモリとプロセッシング・ユニット間で大量のデータを移動し、高い帯域幅と継続的な電力供給が必要な密行列演算を実行することで情報を処理します。このアプローチは、ニューラルネットワーク推論が含む高度に並列な同期計算に効率的ですが、データ移動、クロック分散、および現在計算に寄与していない回路要素のアクティブ状態を維持する必要性から生じるエネルギーコストを伴います。

生物学的神経回路は非常に異なる方法で情報を処理します。ニューロンは主にサイレント状態であり、信号がしきい値を超えた場合にのみ発火し、計算は集中処理ユニットに集中するのではなく、ネットワーク全体に分散されています。脳は約20ワットの継続電力で注目すべき認知パフォーマンスを達成します。これは、比較可能なタスクを実行する場合、現在のAIハードウェアが到達できないベンチマークです。

神経形態チップは、シリコン内でこのスパイクベース、イベント駆動アーキテクチャのエネルギー効率をキャプチャしようとしています。連続クロック計算の代わりに、神経形態プロセッサは入力がしきい値を超えた場合にのみ発火し、計算ステップ間で完全な電力でアイドル状態にならずにアクティブ処理にのみエネルギーを消費します。

70%の効率向上

研究チームは、画像分類、自然言語推論、センサフュージョンを含むいくつかの標準的なAIベンチマークタスクで70%のエネルギー削減を達成しました。これらは、エッジデバイス、サーバーファーム、モバイルアプリケーションで毎日数十億回実行されるタイプのAI操作です。エネルギー利点は、スパースでイベント駆動型の入力(センサーデータ、音声ストリーム、断続的なクエリパターン)の場合に最も顕著でした。ここでは、神経形態チップがイベント間でアイドル状態になる機能により、入力レートに関わらずクロック活動を維持する必要があるプロセッサと比べて構造的な利点が得られます。

チップは修正された標準半導体プロセスを使用して製造されました。これは、異種製造を必要とする以前の神経形態研究プラットフォームと比較して、重要な実践的な違いです。従来の半導体インフラストラクチャを使用することは、専用の製造投資を必要とするのではなく、既存のチップファウンドリーを通じてテクノロジーをスケーリングできる可能性があることを意味します。

アプリケーションと制限

最も直接的なアプリケーションの目標はエッジAIシナリオです。産業IoTのセンサーノード、補聴器と医療インプラント、消費者向け電子機器の常時キーワード検出、およびバッテリー寿命または熱制約がAI推論に利用可能な電力予算を制限する自動運転車両の知覚システムです。これらのアプリケーションは、スパースで現実世界のセンサーデータに対して継続的または高頻度で推論を実行するという特徴を共有しており、これはまさに神経形態効率の利点が最大のレジームです。

データセンターAIワークロード、特にクエリが密でバッチ処理が一般的な大規模言語モデル推論の場合、エネルギー利点はそれほど劇的ではありません。神経形態プロセッサが従来のGPUで実行されるAIフレームワークとモデルの全範囲を実行できるようになる前に、大幅なソフトウェアエコシステムの作業が残っており、これは広範な採用への主な実践的障壁です。

競争環境

複数の大手技術企業と研究機関がアクティブな神経形態プログラムを持っています。IntelのLoihiチップは特定のタスクでエネルギー効率の利点を実証しており、IBMのTrueNorthは10年以上の研究アプリケーションに使用されています。Innatera、SpiNNcloud、BrainChipを含むスタートアップは、エッジアプリケーションを対象とした商用神経形態製品を開発しました。70%のエネルギー削減数値は、AI インフラストラクチャに関連する天文学的な電気料金を削減できるあらゆるテクノロジーを積極的に探しているハイパースケールデータセンター運営者から大きな関心を集めるでしょう。これは、規模でAIを運用しているすべての主要な技術企業にとって中心的な戦略的懸念事項となっています。

この記事はInteresting Engineeringのレポートに基づいています。元の記事を読む