NVIDIA、最新ドライバでGeForce RTX GPU、RTX PC、RTXワークステーションのAIパフォーマンスを3倍向上

NVIDIAは、最新のR555ドライバリリースにより、GeForce RTX GPUおよびRTX AI PCプラットフォームのAI性能をさらに向上させました。

NVIDIAのGeForce RTX GPUとRTX PCは、すべてのセグメントで最速のAI性能を提供し、最新のドライバによって3倍に向上しました。

本日のMicrosoft Buildにおいて、NVIDIAは、GeForce RTX GPU、ワークステーション、PCを含むRTXプラットフォームで利用可能になった、さまざまな新しいAIパフォーマンスの最適化を発表しました。

この新しい最適化は、特に、最新のジェネレーティブAI体験の原動力となるさまざまなLLM（大規模言語モデル）を対象としています。

最新のR555ドライバを使用することで、NVIDIAのRTX GPUとAI PCプラットフォームは、ONNX Runtime（ORT）とDirectMLで最大3倍高速なAIパフォーマンスを提供します。

これら2つのツールは、Windows PC上でローカルにAIモデルを実行するために使用されます。

それに加えて、WebNNはDirectMLを介してRTXで高速化されている。これは、ウェブ開発者が新しいAIモデルを展開するためのアプリケーション・プログラミング・インターフェースである。

MicrosoftはNVIDIAと協力し、PyTorchでDirectMLサポートを追加する一方で、RTX GPU性能をさらに加速させる。

以下は、新しいR555ドライバがGeForce RTX GPUおよびRTX PCに提供する機能の全リストです：

LLM用のINT4重みのみの量子化を扱うDQ-GEMMメタコマンドのサポート
Llama 2、Llama 3、MistralおよびPhi-3モデル用の新しいRMSNorm正規化メソッド
Mistralをサポートするためのグループおよびマルチクエリーアテンションメカニズムとスライディングウィンドウアテンション
インプレースKV更新によるアテンション性能の向上
非8重TensorのGEMMをサポートし、コンテキストフェーズの性能を向上。

MicrosoftがリリースしたジェネレーティブAI拡張機能であるORTの性能ベンチマークにおいて、NVIDIAはINT4とFP16の両データ型で軒並み向上を示しています。

この性能向上は、Phi-3、Llama 3、Gemma、MistralなどのLLM用にこれらの拡張機能内に追加された最適化技術のおかげで、最大3倍となっています。

これらの機能強化に加え、NVIDIAは強力なTensorRTとTensorRT-LLMスイートでコンシューマー向けAI PC分野をリードしてきた。

NVIDIAはまた、TensorコアなどのGPUに組み込まれたAIハードウェアを動力源とする多様なソリューションも提供している。

これらのソリューションには、画期的なDLSS超解像技術、NVIDIA ACE、RTX Remix、Omniverse、Broadcast、RTX Video、その他いくつかの技術が含まれる。

NVIDIAのGPUは、最大1300TOPSのAIコンピューティングを提供し、100TOPSにとどまると予想される今年発売される最速のチップをはるかに凌駕する。

さらに、これらのPCには最新のNVIDIA RTX GPUが搭載され、RTX AI PCプラットフォームがさらに強化され、コンシューマー分野におけるAI分野がさらに推進されることになる。

ソース：wccftech – NVIDIA Further Boosts AI Performance By 3x For GeForce RTX GPUs, RTX PC & RTX Workstations With Latest Driver

解説：

NVIDIA R555ドライバーでONNX-DirectMLのパフォーマンスを3倍へ

AI性能が3倍という話が出ていたので注目していたのですが、ONNX-DirectMLという文字を見て、解散!という気分になりました。

元記事では主にローカルLLMの性能が向上するようなことが書いてあります。

昨日Copilot+PCというマイクロソフトが提唱するAI PCの基準が発表されましたが、NVIDIA製のGPUでこれらの規格をクリアできるのですかねえ。

NPUのAI性能が40TOPS以上無いとダメらしいです。

このようにどうもAI PCはLLMをローカルで実行できるということを基準にするようです。

NPUだけでなく、dGPUのAI性能でも代替できるのかどうかは不明です。

NPUの代わりができるようになるのかどうかは不明ですが、NVIDIAのAIに対する対応は非常に早く、AMDやIntelよりもかなり先をいっていることは確かでしょう。

AMDもRadeonで早急に生成AIが使える環境を整えないとどんどん引き離れさてしまいます。

APUにNPUを内蔵する一方でdGPUのAI対応は一向に進んでいないのが気になるところです。

NVIDIAは自前のNPUをPC向けには持っていませんが、このような情報を見ると、万全な体制なのかなと思います。

nVidia RTX4000SUPER

PNY GeForce RTX 4080 SUPER 16GB VERTO OC LED 3FAN PCIe4.0 GDDR6X 3スロット厚・3ファン NVIDIAリファレンスデザイン 3年保証グラフィックスカード VCG4080S16TFXPB1-O VD8758

created by Rinker

PNY Technologies

¥180,600
(2024/05/21 09:40:19時点 Amazon調べ-詳細)

GAINWARD RTX 4070Ti SUPER Panther 16GB GDDR6X PCIe4.0 3.1スロット・3ファン搭載グラフィックスカード NED47TSS19T2-1043Z-G VD8743

created by Rinker

GAINWARD

¥146,778
(2024/05/21 09:47:23時点 Amazon調べ-詳細)

PNY GeForce RTX 4070 Super 12GB VERTO OC PCIe4.0 2スロット・2ファン搭載グラフィックスカード VCG4070S12DFXPB1-O VD8762

created by Rinker

PNY Technologies

¥103,800
(2024/05/21 09:43:08時点 Amazon調べ-詳細)

nVidia RTX4000

PNY ピーエヌワイ GeForce RTX4090 24GB VERTO LED 3FAN グラフィックスボード VCG409024TFXPB1 VD8270

created by Rinker

PNY Technologies

¥312,929
(2024/05/21 09:47:24時点 Amazon調べ-詳細)

玄人志向 NVIDIA GeForce RTX4060 搭載グラフィックボード GDDR6 8GB 搭載モデル【国内正規品】 GG-RTX4060-E8GB/SF

created by Rinker

玄人志向

¥49,000
(2024/05/21 09:47:51時点 Amazon調べ-詳細)

nVidia RTX3000シリーズGPU

RTX3060 12GB GDDR6

ZOTAC GeForce RTX 3060 Twin Edge OC グラフィックスボード ZT-A30600H-10M VD7558

created by Rinker

ZOTAC

¥51,494
(2024/05/21 14:02:09時点 Amazon調べ-詳細)

RTX3050 6GB

MSI GeForce RTX 3050 LP 6G OC PCIe4.0 ロープロファイルサイズ補助電源不要デュアルファン搭載グラフィックスボード VD8790

created by Rinker

MSI

¥33,130
(2024/05/21 09:47:25時点 Amazon調べ-詳細)

Newskey

NVIDIA、最新ドライバでGeForce RTX GPU、RTX PC、RTXワークステーションのAIパフォーマンスを3倍向上

Archives