文書の切り方で、拾える根拠が変わる
Chunkは単独の技術ではなく、答えを作る前の資料整理です。
ふつう向けsentence_splitter_ja 相当
文ごとに自然に切るため、FAQや短い説明文で扱いやすい設定です。
分割後のチャンク
外部アンケートの回答完了が確認されると、通常は数分以内にポイントが仮反映されます。
42 tokens運営確認が必要な回答は、確認後にポイントが確定します。
28 tokens 「ポイントはいつ反映されますか?」での検索結果
正しく取得回答に必要な文が上位に出るため、FAQ向けでは扱いやすい結果です。
長文に強いrecursive_ja_splitter 相当
周辺文脈を少し広めに残すため、規約や長い説明文で有効です。
分割後のチャンク
ポイントは外部アンケートの回答完了通知を受け取った後に仮反映されます。ただし、不正回答の確認や運営確認が必要な場合は、確定までに時間を要することがあります。
74 tokens 「ポイントはいつ反映されますか?」での検索結果
情報は厚いが少し長い条件や例外まで含めて拾える一方、短いFAQでは情報量がやや多くなります。
速度重視baseline_char_splitter 相当
単純な切り方で高速に処理できますが、質問によっては必要な文脈を取りこぼすことがあります。
分割後のチャンク
外部アンケート回答後、ポイントが反映されます。運営確認が必要な場合があります。
35 tokens 「ポイントはいつ反映されますか?」での検索結果
速いが説明が薄い処理は軽いものの、反映タイミングの説明が不足しやすい設定です。