🔍 Training vs Searchable Documents

学習専用データと検索対象データの分離デモ

📊 統計情報

0
全ドキュメント数
0
学習専用
0
検索対象
0
語彙サイズ

🔄 モデル再学習

待機中
自動再学習: ドキュメント数の10%以上が変更されると自動的に再学習が開始されます。 強制再学習ボタンで手動実行も可能です。

➕ ドキュメント追加

学習専用データ: モデルの学習には使用されますが、検索結果には現れません。 背景知識や文脈情報として活用されます。
検索対象データ: 学習にも使用され、検索結果として返されます。 実際に検索したいコンテンツを追加します。
バッチ追加: サンプルデータを一括で追加できます。

🔍 類似検索

💡 使用例

// 大量の背景知識を学習データとして追加
for (let doc of wikipediaArticles) {
    embedder.add_document_for_training(doc, 64);
}

// 実際に検索したいドキュメントを追加
for (let doc of productDescriptions) {
    embedder.add_document(doc, 64);
}

// 高速検索(検索対象のみから結果が返る)
const results = embedder.find_similar("ユーザーのクエリ", 10);