AIがどうやって答えを作るか

利用案内AIの技術的な仕組みを解説します。

全体フロー

質問を受け取る

キーワード分析 → RAG戦略を自動選択（またはユーザー指定）

選ばれた戦略で「証拠」を検索

証拠をLLMに渡して回答生成

根拠付き回答 + エスカレーション判定を返す

FAQをEmbedding→コサイン類似度上位k件

Embedding使用LLM未使用（検索時）

ベクトル×0.62 + 語句一致×0.22 + 完全一致×0.12 + ブースト×0.04

Embedding使用LLM未使用（検索時）

見出しをパース→キーワードスコアで節を絞る

Embedding不要LLM未使用（検索時）

glob → grep → readRange

Embedding不要LLM未使用（検索時）

ポイント: 通常、LLMは回答生成の1回だけ呼ばれます。ただし戦略比較モード（2つ以上の戦略を選択）では、各戦略ごとに1回ずつ呼ばれます。

プロバイダー: OpenAI

モデル: text-embedding-3-small

ベクトル次元数: 1,536次元

用途: FAQテキスト全件を事前にベクトル化してインデックス構築

プロバイダー: Anthropic

モデル: Claude Haiku

用途: 証拠がある場合のみ呼び出し（根拠なし時は呼ばない）

出力: 構造化JSON（answerText / grounded / shouldEscalate / usedEvidenceIds）

「規約」「失効」「個人情報」→ 長文構造検索

「最新」「更新」「ファイル」→ ファイル探索型検索

「ポイント」「フォーム」「アンケート」→ 意味＋キーワード検索

その他→ 純粋ベクトル検索（ベースライン）

推奨戦略で証拠なし → 全戦略を実行してスコア最上位へ自動フォールバック