博報堂テクノロジーズは、日本語に特化した視覚言語事前学習モデル(VLP)「Japanese CLIP ViT-H/14」を開発し、Hugging Face上で無償公開した(非商用限定)。「桜の花が満開の公園」など具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すといったことが可能になるという。 視覚言語事前学習モデル(Vision-Language Pre-training/V …
博報堂テクノロジーズは、日本語に特化した視覚言語事前学習モデル(VLP)「Japanese CLIP ViT-H/14」を開発し、Hugging Face上で無償公開した(非商用限定)。「桜の花が満開の公園」など具体的なシーンを日本語で検索した際、関連度の高い画像を正確に見つけ出すといったことが可能になるという。 視覚言語事前学習モデル(Vision-Language Pre-training/V …