Mixture of Experts(MoE)は、ニューラルネットワークの効率を...
Vision Transformer(ViT)は、2020年にGoogleの研究...
CLIP(Contrastive Language-Image Pre-trai...
Stable Diffusionは、2022年にStability AI、Com...
VAE(Variational Autoencoder、変分オートエンコーダ)は...
U-Netは、もともと医用画像のセグメンテーションのために2015年に提案された...
Classifier-Free Guidance(CFG)は、2022年にHo ...
ControlNetは、2023年にZhangらが発表した、拡散モデルに空間的な...
Imagen(Google)とDALL-E(OpenAI)は、テキストから画像を...
マルチモーダルLLM(Large Language Model)は、テキストだけ...