ブーストレランカー
ベクトル距離に基づくセマンティック類似度の計算のみに依存する代わりに、ブーストレランカーを使用すると、検索結果に意味のある方法で影響を与えることができます。これは、メタデータフィルタリングを使用して検索結果を迅速に調整するのに理想的です。
検索要求にブーストレランカー関数が含まれている場合、Milvusはその関数内のオプションなフィルタリング条件を使用して検索結果の候補の中から一致を検索し、指定された重みを適用して一致したエンティティのスコアをブーストします。これにより、一致したエンティティのランキングを最終結果で昇格または降格できます。
ブーストレランカーの使用タイミング
交差エンコーダーモデルまたはフュージョンアルゴリズムに依存する他のランカーとは異なり、ブーストレランカーはオプションのメタデータ駆動ルールを直接ランキングプロセスに注入するため、以下のシナリオで特に適しています。
ユースケース | 例 | なぜブーストレランカーが適しているのか |
|---|---|---|
ビジネス駆動型のコンテンツ優先順位付け |
| インデックスの再構築やベクトル埋め込みモデルの変更(時間のかかる操作)を必要とせず、リアルタイムでオプションのメタデータフィルターを適用することで検索結果の特定のアイテムをすぐに昇格または降格できます。このメカニズムにより、進化するビジネス要件に簡単に適応できる柔軟で動的な検索ランキングが可能になります。 |
戦略的コンテンツの降格 |
|
複数のブーストレランカーを組み合わせて、より動的で堅牢な重みベースのランキング戦略を実装することもできます。
ブーストレランカーの仕組み
以下の図は、ブーストレランカーの主なワークフローを示しています。

データを挿入する際、Zilliz Cloudはそれをセグメント間で分散します。検索中、各セグメントは候補セットを返し、Zilliz Cloudはこれらのすべてのセグメントからの候補をランキングして最終結果を生成します。検索要求にブーストレランカーが含まれている場合、Zilliz Cloudは各セグメントからの候補結果に適用して、潜在的な精度の損失を防止し、リコールを改善します。
結果を確定する前、Milvusはこれらの候補を以下のようにブーストレランカーで処理します:
-
ブーストレランカーで指定されたオプションのフィルタリング式を適用して、式に一致するエンティティを識別します。
-
ブーストレランカーで指定された重みを適用して、識別されたエンティティのスコアをブーストします。
マルチベクトルハイブリッド検索のランカーとしてブーストレランカーを使用することはできません。ただし、サブリクエスト(AnnSearchRequest)のいずれかのランカーとしては使用できます。
ブーストレランカーの例
以下の例は、シングルベクトル検索でブーストレランカーを使用する方法を示しています。この検索では、上位5つの最も関連性の高いエンティティを返すと同時に、抽象ドックタイプを持つエンティティのスコアに重みを追加する必要があります。
-
セグメント内の検索結果候補を集める。
以下の表では、Milvusがエンティティを2つのセグメント(0001および0002)に分散し、各セグメントが5つの候補を返すと仮定します。
ID
ドックタイプ
スコア
ランク
セグメント
117
abstract
0.344
1
0001
89
abstract
0.456
2
0001
257
body
0.578
3
0001
358
title
0.788
4
0001
168
body
0.899
5
0001
46
body
0.189
1
0002
48
body
0265
2
0002
561
abstract
0.366
3
0002
344
abstract
0.444
4
0002
276
abstract
0.845
5
0002
-
ブーストレランカーで指定されたフィルター式を適用 (
doctype='abstract')。以下の表の
ドックタイプフィールドで示されるように、Milvusはdoctypeがabstractに設定されたすべてのエンティティを後続の処理のためにマークします。ID
ドックタイプ
スコア
ランク
セグメント
117
abstract
0.344
1
0001
89
abstract
0.456
2
0001
257
body
0.578
3
0001
358
title
0.788
4
0001
168
body
0.899
5
0001
46
body
0.189
1
0002
48
body
0265
2
0002
561
abstract
0.366
3
0002
344
abstract
0.444
4
0002
276
abstract
0.845
5
0002
-
ブーストレランカーで指定された重みを適用 (
weight=0.5)。前のステップで識別されたすべてのエンティティは、ブーストレランカーで指定された重みで乗算され、ランクに変化が生じます。
ID
ドックタイプ
スコア
加重スコア
(= スコア × 重み)
ランク
セグメント
117
abstract
0.344
0.172
1
0001
89
abstract
0.456
0.228
2
0001
257
body
0.578
0.578
3
0001
358
title
0.788
0.788
4
0001
168
body
0.899
0.899
5
0001
561
abstract
0.366
0.183
1
0002
46
body
0.189
0.189
2
0002
344
abstract
0.444
0.222
3
0002
48
body
0.265
0.265
4
0002
276
abstract
0.845
0.423
5
0002
📘注釈重みは選択した浮動小数点数である必要があります。上記の例のように、スコアが小さいほど関連性が高いと判断される場合は、1より小さい重みを使用します。それ以外の場合は、1より大きい重みを使用します。
-
すべてのセグメントからの候補を集約し、加重スコアに基づいて結果を確定します。
ID
ドックタイプ
スコア
加重スコア
ランク
セグメント
117
abstract
0.344
0.172
1
0001
561
abstract
0.366
0.183
2
0002
46
body
0.189
0.189
3
0002
344
abstract
0.444
0.222
4
0002
89
abstract
0.456
0.228
5
0001
ブーストレランカーの使用方法
このセクションでは、シングルベクトル検索の結果に影響を与えるためにブーストレランカーを使用する方法の例を示します。
ブーストレランカーの作成
検索要求の再ランカーとしてブーストレランカーを渡す前に、以下のように再ランキング関数として適切に定義する必要があります:
- Python
- Java
- Go
- NodeJS
- cURL
from pymilvus import Function, FunctionType
ranker = Function(
name="boost",
input_field_names=[], # 空のリストでなければならない
function_type=FunctionType.RERANK,
params={
"reranker": "boost",
"filter": "doctype == 'abstract'",
"random_score": {
"seed": 126,
"field": "id"
},
"weight": 0.5
}
)
import io.milvus.v2.service.vector.request.ranker.BoostRanker;
BoostRanker ranker = BoostRanker.builder()
.name("boost")
.filter("doctype == \"abstract\"")
.weight(5.0f)
.randomScoreField("id")
.randomScoreSeed(126)
.build();
// go
import {FunctionType} from '@zilliz/milvus2-sdk-node';
const ranker = {
name: "boost",
input_field_names: [],
type: FunctionType.RERANK,
params: {
reranker: "boost",
filter: "doctype == 'abstract'",
random_score: {
seed: 126,
field: "id",
},
weight: 0.5,
},
};
# restful
パラメータ | 必須? | 説明 | 値/例 |
|---|---|---|---|
| はい | この関数の一意識別子 |
|
| はい | 関数を適用するベクトルフィールドのリスト(ブーストレランカーでは空のリストにする必要があります) |
|
| はい | 呼び出す関数のタイプ。再ランキング戦略を指定するには |
|
| はい | 再ランカーのタイプを指定します。 ブーストレランカーを使用するには |
|
| はい | 生の検索結果で一致したエンティティのスコアに乗算される重みを指定します。 値は浮動小数点数である必要があります。
|
|
| いいえ | 検索結果エンティティの中から一致するエンティティを見つけるために使用されるフィルター式を指定します。これはフィルタリングの説明で述べられている有効な基本フィルター式のいずれかでも構いません。 注釈: |
|
| いいえ | 0から1の間の値をランダムに生成する乱数関数を指定します。以下の2つのオプショナル引数があります:
|
|
単一のブーストレランカーでの検索
ブーストレランカー関数の準備ができたら、検索要求で参照できます。以下の例では、すでに以下のフィールドを持つコレクションを作成したと仮定しています:id、vector、およびdoctype。
- Python
- Java
- Go
- NodeJS
- cURL
from pymilvus import MilvusClient
# Milvusサーバーに接続
client = MilvusClient(
uri="YOUR_CLUSTER_ENDPOINT",
token="YOUR_CLUSTER_TOKEN"
)
# コレクションがすでに設定されていると仮定
# 作成したランカーを使用して類似性検索を実行
client.search(
collection_name="my_collection",
data=[[-0.619954382375778, 0.4479436794798608, -0.17493894838751745, -0.4248030059917294, -0.8648452746018911]],
anns_field="vector",
params={},
output_field=["doctype"],
ranker=ranker
)
import io.milvus.v2.client.ConnectConfig;
import io.milvus.v2.client.MilvusClientV2;
import io.milvus.v2.service.vector.request.SearchReq;
import io.milvus.v2.service.vector.response.SearchResp;
import io.milvus.v2.service.vector.request.data.FloatVec;
MilvusClientV2 client = new MilvusClientV2(ConnectConfig.builder()
.uri("YOUR_CLUSTER_ENDPOINT")
.build());
SearchResp searchResp = client.search(SearchReq.builder()
.collectionName("my_collection")
.data(Collections.singletonList(new FloatVec(new float[]{-0.619954f, 0.447943f, -0.174938f, -0.424803f, -0.864845f})))
.annsField("vector")
.outputFields(Collections.singletonList("doctype"))
.functionScore(FunctionScore.builder()
.addFunction(ranker)
.build())
.build());
// go
import { MilvusClient } from '@zilliz/milvus2-sdk-node';
// Milvusサーバーに接続
const client = new MilvusClient({
address: 'YOUR_CLUSTER_ENDPOINT',
token: 'YOUR_CLUSTER_TOKEN'
});
// コレクションがすでに設定されていると仮定
// 類似性検索を実行
const searchResults = await client.search({
collection_name: 'my_collection',
data: [-0.619954382375778, 0.4479436794798608, -0.17493894838751745, -0.4248030059917294, -0.8648452746018911],
anns_field: 'vector',
output_fields: ['doctype'],
rerank: ranker,
});
console.log('検索結果:', searchResults);
# restful
複数のブーストレランカーでの検索
検索結果に影響を与えるために、単一の検索で複数のブーストレランカーを組み合わせることができます。これを行うには、複数のブーストレランカーを作成し、FunctionScoreインスタンスで参照し、検索要求でFunctionScoreインスタンスをランカーとして使用します。
以下の例は、識別されたすべてのエンティティのスコアを0.8から1.2の重みで修正する方法を示しています。
- Python
- Java
- Go
- NodeJS
- cURL
from pymilvus import MilvusClient, Function, FunctionType, FunctionScore
# 固定重みを持つブーストレランカーを作成
fix_weight_ranker = Function(
name="boost",
input_field_names=[], # 空のリストでなければならない
function_type=FunctionType.RERANK,
params={
"reranker": "boost",
"weight": 0.8
}
)
# 0から0.4の間のランダム重みを持つブーストレランカーを作成
random_weight_ranker = Function(
name="boost",
input_field_names=[], # 空のリストでなければならない
function_type=FunctionType.RERANK,
params={
"reranker": "boost",
"random_score": {
"seed": 126,
},
"weight": 0.4
}
)
# FunctionScoreを作成
ranker = FunctionScore(
functions=[
fix_weight_ranker,
random_weight_ranker
],
params={
"boost_mode": "Multiply",
"function_mode": "Sum"
}
)
# 作成したFunctionScoreを使用して類似性検索を実行
client.search(
collection_name="my_collection",
data=[[-0.619954382375778, 0.4479436794798608, -0.17493894838751745, -0.4248030059917294, -0.8648452746018911]],
anns_field="vector",
params={},
output_field=["doctype"],
ranker=ranker
)
import io.milvus.common.clientenum.FunctionType;
import io.milvus.v2.service.collection.request.CreateCollectionReq;
CreateCollectionReq.Function fixWeightRanker = CreateCollectionReq.Function.builder()
.functionType(FunctionType.RERANK)
.name("boost")
.param("reranker", "boost")
.param("weight", "0.8")
.build();
CreateCollectionReq.Function randomWeightRanker = CreateCollectionReq.Function.builder()
.functionType(FunctionType.RERANK)
.name("boost")
.param("reranker", "boost")
.param("weight", "0.4")
.param("random_score", "{\"seed\": 126}")
.build();
Map<String, String> params = new HashMap<>();
params.put("boost_mode","Multiply");
params.put("function_mode","Sum");
FunctionScore ranker = FunctionScore.builder()
.addFunction(fixWeightRanker)
.addFunction(randomWeightRanker)
.params(params)
.build();
SearchResp searchResp = client.search(SearchReq.builder()
.collectionName("my_collection")
.data(Collections.singletonList(new FloatVec(new float[]{-0.619954f, 0.447943f, -0.174938f, -0.424803f, -0.864845f})))
.annsField("vector")
.outputFields(Collections.singletonList("doctype"))
.functionScore(ranker)
.build());
// go
import {FunctionType} from '@zilliz/milvus2-sdk-node';
const fix_weight_reranker = {
name: "boost",
input_field_names: [],
type: FunctionType.RERANK,
params: {
reranker: "boost",
weight: 0.8,
},
};
const random_weight_reranker = {
name: "boost",
input_field_names: [],
type: FunctionType.RERANK,
params: {
reranker: "boost",
random_score: {
seed: 126,
},
weight: 0.4,
},
};
const ranker = {
functions: [fix_weight_reranker, random_weight_reranker],
params: {
boost_mode: "Multiply",
function_mode: "Sum",
},
};
await client.search({
collection_name: "my_collection",
data: [[-0.619954382375778, 0.4479436794798608, -0.17493894838751745, -0.4248030059917294, -0.8648452746018911]],
anns_field: "vector",
params: {},
output_fields: ["doctype"],
ranker: ranker
});
# restful
具体的には、2つのブーストレランカーがあります:1つは見つかったすべてのエンティティに固定重みを適用し、もう1つはそれらにランダム重みを割り当てます。次に、これらの2つのランカーをFunctionScoreで参照し、見つかったエンティティのスコアに重みがどのように影響するかを定義します。
以下の表は、FunctionScoreインスタンスを作成するために必要なパラメータを示しています。
パラメータ | 必須? | 説明 | 値/例 |
|---|---|---|---|
| はい | リスト内のターゲットランカーの名前を指定します。 |
|
| いいえ | 指定された重みが一致したエンティティのスコアにどのような影響を与えるかを指定します。 可能な値は以下の通りです:
|
|
| いいえ | さまざまなブーストレランカーからの重み付き値がどのように処理されるかを指定します。 可能な値は以下の通りです:
|
|