Multi-Model

Multi-Modelの概念について学ぶ。

Multi-Modelとは？

一つのAIシステムで複数のモデルを一緒に使うアプローチを指す。
つまり、単一モデルにすべてを任せるのではなく、各モデルの強みを組み合わせることで、より高い性能や多様な機能を得る方法である。

たとえば、テキストだけでなく画像、音声、動画まで一緒に処理できるモデルである。

マルチモーダル（Multi-Modal）とは異なる
- Multi-Model != Multi-Modal
- Multi-Modal: 画像+テキスト+音声など、複数の入力形式を処理する一つのモデル
- Multi-Model: 複数のモデルを組み合わせてシステムを構成
構成方式
- 並列（Ensemble）: 複数のモデルが同時に答えを出し、結果を統合して最終決定
  - 例: 投票（Voting）、平均（Blending）、重み付き組み合わせ（Weighted Sum）
- 直列（Pipeline）: あるモデルの出力を別のモデルの入力として渡す
  - 例: 画像キャプションモデル -> テキスト要約モデル -> 質疑応答モデル
- ハイブリッド: 状況に応じてモデルを選択する（Routerモデル）

Multi-Modelは複数のモデルを組み合わせ、それぞれの強みを生かしてより良い結果を出すシステム設計方式である。

例として、「検索モデル + 生成モデル」、「小さなモデル + 大きなモデル」、「特化モデル + 汎用モデル」を組み合わせる方式がある。