MicrosoftがLLM推論のGPU使用効率を向上させる「Splitwise」発表 (マイナビニュース)

Posted byWpmaster
01/06/2024

Microsoftの研究者は2024年1月4日、公式ブログ「Splitwise improves GPU usage by splitting LLM inference phases」において、大規模言語モデル(LLM)を使用した推論においてGPUの使用効率を向上させる「Splitwise」と名付けられたシステムについて解説した。 Splitwiseでは、LLM推論を2つのフェーズした上で別のマ …

Newskey

MicrosoftがLLM推論のGPU使用効率を向上させる「Splitwise」発表 (マイナビニュース)

Archives