もっと詳しく

5nmH100 GPUAIGaudi 3

Gaudi 3 AINVIDIA40%50%AI

IntelGaudi AIAINVIDIAGPU

Gaudi 2NVIDIA A100/H100 GPUNVIDIAAIIntelperf/$

AI3Gaudi 3

Gaudi 35Tensor Core264

GPU96MB128GB3.7TB/16Gb HBM2e DRAM8-hi8HBMTSMC 5nm24200GbE

Gaudi 3 AI900W900WMezzanine OAMHL-325L10.5PCIe AICGaudi 3 HL-338 PCIeOAMTDP 600W

8Gaudi 3HLB-325HLFB-325LTDP7.619

Gaudi 32025Falcon ShoresIntel oneAPIGPUGaudiXeIP

: インテルは、Intel Visionにおいて、Intel Gaudi 3 AIアクセラレーターを発表します。

BF164AI1.52

Gaudi 3AI

GenAI 効率的な大規模AIコンピューティングのために設計されたIntel Gaudi 3アクセラレータは、5ナノメートル(nm)プロセスで製造され、前世代よりも大幅に進化しています。 マトリックス乗算エンジン(MME)、テンソル・プロセッサー・コア(TPC)、ネットワーキング・インターフェース・カード(NIC)など、すべてのエンジンを並列に起動できるように設計されており、高速で効率的なディープラーニングの計算とスケールに必要なアクセラレーションを可能にします。主な特徴は以下のとおりです:

AIインテル Gaudi 3アクセラレーターは、高性能で高効率なGenAIコンピュート向けに設計されています。 各アクセラレーターは、64個のAIカスタム・プログラマブルTPCと8個のMMEで構成されるヘテロジニアス・コンピュート・エンジンを独自に備えています。各Intel Gaudi 3 MMEは、驚異的な64,000並列演算が可能で、高度な計算効率を実現し、ディープラーニング・アルゴリズムの基本である複雑な行列演算の処理に優れています。このユニークな設計により、AIの並列演算の速度と効率が加速され、FP8やBF16を含む複数のデータタイプをサポートしています。

LLM 128ギガバイト(GB)のHBMe2メモリ容量、3.7テラバイト(TB)のメモリ帯域幅、および96メガバイト(MB)のオンボードスタティックランダムアクセスメモリ(SRAM)は、より少ないIntel Gaudi 3で大規模なGenAIデータセットを処理するための十分なメモリを提供します。エンタープライズGenAIのための効率的なシステムスケーリング:24個の200ギガビット(Gb)イーサネットポートがすべてのIntel Gaudi 3アクセラレータに統合されており、柔軟でオープンスタンダードなネットワーキングを提供します。これにより、大規模なコンピュート・クラスターをサポートするための効率的なスケーリングが可能になり、独自のネットワーキング・ファブリックによるベンダーロックインを排除します。Intel Gaudi 3アクセラレータは、GenAIモデルの拡張要件を満たすために、単一ノードから数千ノードまで効率的にスケールアップおよびスケールアウトできるように設計されています。

Intel GaudiソフトウェアはPyTorchフレームワークを統合し、最適化されたHugging Faceコミュニティベースのモデルを提供します。これにより、GenAI開発者は、使いやすさと生産性、ハードウェアの種類を超えたモデルの移植を容易にするために、高い抽象化レベルで操作することができます。

Gaudi 3 PCIeGaudi 3ペリフェラル・コンポーネント・インターコネクト・エクスプレス(PCIe)アドインカードが新たに製品ラインに加わりました。低消費電力で高効率を実現するこの新しいフォームファクターは、微調整、推論、RAG(retrieval-augmented generation)などのワークロードに最適です。600Wのフルハイト・フォームファクターを備え、メモリ容量は128GB、帯域幅は毎秒3.7TBです。

Gaudi 3GenAI

Intel Gaudi 3NVIDIA H100

  • Llama2 7Bおよび13Bパラメータ、GPT-3 175Bパラメータモデルにおいて、time-to-trainを50%高速化。
  • Llama 7Bおよび70Bパラメータ、Falcon 180Bパラメータモデルにおいて、推論スループットが50%高速化し、推論の電力効率が40%向上。より長い入出力シーケンスにおける推論性能の優位性。
  • NVIDIA H200に対して、Llama 7B、70Bパラメータ、およびFalcon 180Bパラメータモデルで30%高速な推論。

Gaudi 3OAM20242OEM

Gaudi 3OEMDell TechnologiesHPELenovoSupermicro

Intel Gaudi 320243Intel Gaudi 3 PCIe2024

Gaudi 3LLMNAVER

ソース:wccftech Intel Gaudi 3 AI Accelerator Official: 5nm, 128 GB HBM2e, Up To 900W, 50% Faster Than NVIDIA H100 & 40% More Efficient

 

 

 

 

Intel Gaudi 3AMD MI300

AI/MLIntel Gaudi 3

40%50%

IntelGPU使使

CUDAZLUDAIntelOneAPICUDA

AMDROCm使CUDA

使使

OneAPI

ipexCPUROCm

Intel()使

 

 

Intel GPU ARC A

 

 

 

Copyright © 2024 PC All Rights Reserved.