文書の切り方で、拾える根拠が変わる

Chunkは単独の技術ではなく、答えを作る前の資料整理です。

ふつう向けsentence_splitter_ja 相当

文ごとに自然に切るため、FAQや短い説明文で扱いやすい設定です。

分割後のチャンク

外部アンケートの回答完了が確認されると、通常は数分以内にポイントが仮反映されます。

42 tokens

運営確認が必要な回答は、確認後にポイントが確定します。

28 tokens
「ポイントはいつ反映されますか?」での検索結果
正しく取得

回答に必要な文が上位に出るため、FAQ向けでは扱いやすい結果です。

長文に強いrecursive_ja_splitter 相当

周辺文脈を少し広めに残すため、規約や長い説明文で有効です。

分割後のチャンク

ポイントは外部アンケートの回答完了通知を受け取った後に仮反映されます。ただし、不正回答の確認や運営確認が必要な場合は、確定までに時間を要することがあります。

74 tokens
「ポイントはいつ反映されますか?」での検索結果
情報は厚いが少し長い

条件や例外まで含めて拾える一方、短いFAQでは情報量がやや多くなります。

速度重視baseline_char_splitter 相当

単純な切り方で高速に処理できますが、質問によっては必要な文脈を取りこぼすことがあります。

分割後のチャンク

外部アンケート回答後、ポイントが反映されます。運営確認が必要な場合があります。

35 tokens
「ポイントはいつ反映されますか?」での検索結果
速いが説明が薄い

処理は軽いものの、反映タイミングの説明が不足しやすい設定です。