Transformer | 機械学習と情報技術

Vision Transformer (ViT)の理論と実装

2026年1月1日 Transformer

Vision Transformer（ViT）は、2020年にGoogleの研究...

Self-Attention Transformer Vision Transformer ViT 深層学習画像認識

CLIPの対照学習を数式から理解してPythonで実装する

2025年12月30日 Transformer

CLIP（Contrastive Language-Image Pre-trai...

CLIP Transformer Vision Transformer マルチモーダル対照学習深層学習

Imagen・DALL-Eの比較 — テキスト→画像生成モデルの進化

2025年12月21日生成モデル

Imagen（Google）とDALL-E（OpenAI）は、テキストから画像を...

DALL-E Imagen Transformer テキストから画像拡散モデル深層学習画像生成

マルチモーダルLLMの設計パターンと融合手法を解説

2025年12月19日 Transformer

マルチモーダルLLM（Large Language Model）は、テキストだけ...

GPT-4V LLM Transformer Vision-Language マルチモーダル深層学習

LLaVAアーキテクチャの理論と実装

2025年12月18日 Transformer

LLaVA（Large Language and Vision Assistan...

LLaVA LLM Transformer Vision-Language マルチモーダル深層学習

勾配クリッピングの理論と実装

2025年12月1日 Transformer

勾配クリッピング（Gradient Clipping）は、勾配爆発を防ぐための手...

RNN Transformer 勾配クリッピング最適化深層学習

【深層学習】Attention機構の理論と実装に入門する

2022年12月1日 Transformer

Attention機構は、入力データに対して「注目すべき箇所」を動的に特定する仕...

Attention NLP Self-Attention Transformer 機械学習深層学習

[data-arkb-linkbox]{cursor:auto}[data-arkb-link][aria-hidden="true"]{visibility:visible;color:transparent;z-index:0;width:100%;height:100%;pointer-events:auto}a.arkb-boxLink__title{text-decoration:underline}