もっと詳しく

米Appleと米カリフォルニア大学サンタバーバラ校(UCSB)の研究者らは2月5日(現地時間)、マルチモーダル大規模言語モデル(MLLM)によるテキストベースの画像編集についての論文を発表し、その実装である「MGIE」(MLLM-Guided Image Editing)のコードをGitHubで公開した。また、Hugging Faceで試すこともできる。 MGIEは、テキストプロンプトで画像のトリ …