メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

ハイブリッド検索

ハイブリッド検索とは、複数のANN検索を同時に実行し、それらのANN検索から複数の結果セットを再ランク付けし、最終的に単一の結果セットを返す検索方法を指します。ハイブリッド検索を使用することで、検索精度を向上させることができます。Zilliz Cloudは、複数のベクトルフィールドを持つコレクションでハイブリッド検索を実行することをサポートしています。

ハイブリッド検索は、疎密度ベクトル検索やマルチモーダル検索などのシナリオで最も一般的に使用されます。このガイドでは、特定の例を使用して、Zilliz Cloudでハイブリッド検索を実行する方法を示します。

シナリオ

ハイブリッド検索は、次の2つのシナリオに適しています:

異なる種類のベクトルは異なる情報を表すことができ、様々な埋め込みモデルを使用することで、データの異なる特徴や側面をより包括的に表現することができます。例えば、同じ文に対して異なる埋め込みモデルを使用することで、意味的な意味を表す密なベクトルと、文中の単語の頻度を表す疎なベクトルを生成することができます。

  • **疎ベクトル:**疎ベクトルは、高いベクトル次元と非ゼロ値の存在が特徴です。この構造により、従来の情報検索アプリケーションに特に適しています。ほとんどの場合、疎ベクトルで使用される次元数は、1つ以上の言語で異なるトークンに対応しています。各次元には、ドキュメント内でそのトークンの相対的な重要性を示す値が割り当てられます。このレイアウトは、キーワードマッチングを必要とするタスクに有利です。

  • **密集ベクトル:**密集ベクトルは、ニューラルネットワークから派生した埋め込みです。順序付けられた配列に配置されると、これらのベクトルは入力テキストの意味論的本質を捉えます。密集ベクトルはテキスト処理に限定されず、視覚データの意味論を表現するためにコンピュータビジョンでも広く使用されています。これらの密集ベクトルは、通常、テキスト埋め込みモデルによって生成され、ほとんどまたはすべての要素が非ゼロであることを特徴としています。したがって、密集ベクトルは、正確なキーワード一致がなくてもベクトル距離に基づいて最も類似した結果を返すことができるため、意味論的検索アプリケーションに特に効果的です。この機能により、キーワードベースのアプローチでは見逃される可能性がある概念間の関係を捉えることができ、より微妙で文脈に応じた検索結果が得られます。

詳細については、「疎ベクトル」と「密集ベクトル」を参照してください。

マルチモーダル検索とは、複数のモダリティ(画像、動画、音声、テキストなど)にわたる非構造化データの類似性検索を指します。例えば、指紋、声紋、顔の特徴など、様々なモダリティのデータを使用して人物を表現することができます。ハイブリッド検索は、複数の検索を同時にサポートしています。例えば、類似した指紋と声紋を持つ人物を検索することができます。

ワークフロー

ハイブリッド検索を実行するための主なワークフローは次のとおりです:

  1. BERTTransformersなどの埋め込みモデルを使用して、密集したベクトルを生成します。

  2. BM25BGE-M3SPLADEなどの埋め込みモデルを使用して疎ベクトルを生成ます。

  3. Zilliz Cloudにコレクションを作成し、密集ベクトルフィールドと疎ベクトルフィールドの両方を含むコレクションスキーマを定義します。

  4. 前のステップで作成したコレクションに疎密度ベクトルを挿入します。

  5. ハイブリッド検索の実行:密なベクトルに対するANN検索は、上位K件の最も類似した結果のセットを返し、疎なベクトルに対するテキストマッチも上位K件の結果のセットを返します。

  6. 正規化:上位Kの2つの結果のスコアを正規化し、[0,1]の範囲に変換します。

  7. 適切な再ランキング戦略を選択して、2つのトップKの結果セットをマージして再ランキングし、最終的にトップKの結果セットを返します。

SLTxwACw6hp4Dhb0d3DcmCTLnfd

このセクションでは、テキスト検索の精度を高めるために疎密度ベクトルでハイブリッド検索を実行する方法を説明するために、具体的な例を使用します。

複数のベクトルフィールドを持つコレクションを作成する

コレクションを作成する過程には、コレクションスキーマの定義、インデックスパラメーターの構成、コレクションの作成の3つの部分があります。

スキーマの定義

この例では、コレクションスキーマ内で複数のベクトルフィールドを定義する必要があります。現在、各コレクションはデフォルトで最大4つのベクトルフィールドを含めることができます。ただし、必要に応じてproxy.maxVectorFieldNumの値を変更して、コレクションに最大10個のベクトルフィールドを含めることもできます。

次の例では、densesparseが2つのベクトルフィールドであるコレクションスキーマを定義します。

  • id:このフィールドは、テキストIDを格納するためのプライマリキーとして機能します。このフィールドのデータ型はINT64です。

  • text:このフィールドは、テキストコンテンツを格納するために使用されます。このフィールドのデータ型はVARCHARで、最大長は1000文字です。

  • dense:このフィールドは、テキストの密度ベクトルを格納するために使用されます。このフィールドのデータ型はFLOAT_VECTORで、ベクトルの次元は768です。

  • sparse:このフィールドは、テキストの疎なベクトルを格納するために使用されます。このフィールドのデータ型はSPARSE_FLOAT_VECTORです。

# Create a collection in customized setup mode
from pymilvus import (
MilvusClient, DataType
)

client = MilvusClient(
uri="YOUR_CLUSTER_ENDPOINT",
token="YOUR_CLUSTER_TOKEN"
)

# Create schema
schema = MilvusClient.create_schema(
auto_id=False,
enable_dynamic_field=True,
)
# Add fields to schema
schema.add_field(field_name="id", datatype=DataType.INT64, is_primary=True)
schema.add_field(field_name="text", datatype=DataType.VARCHAR, max_length=1000)
schema.add_field(field_name="sparse", datatype=DataType.SPARSE_FLOAT_VECTOR)
schema.add_field(field_name="dense", datatype=DataType.FLOAT_VECTOR, dim=5)

スパースベクトル検索では、全文検索機能を利用してスパース埋め込みベクトルを生成する過程を簡素化できます。詳細については、「フルテキスト検索」を参照してください。

インデックス作成

コレクションスキーマを定義した後、ベクトルインデックスと類似度メトリックを設定する必要があります。この例では、AUTOINDEX のインデックスが、密度の高いベクトルフィールドの両方、denseベクトルフィールドとsparseベクトルフィールド、疎なベクトルフィールドの両方に対して作成されます。

from pymilvus import MilvusClient

# Prepare index parameters
index_params = client.prepare_index_params()

# Add indexes
index_params.add_index(
field_name="dense",
index_name="dense_index",
index_type="AUTOINDEX",
metric_type="IP",
params={"nlist": 128},
)

index_params.add_index(
field_name="sparse",
index_name="sparse_index",
index_type="AUTOINDEX", # Index type for sparse vectors
metric_type="IP", # Currently, only IP (Inner Product) is supported for sparse vectors
params={"drop_ratio_build": 0.2}, # The ratio of small vector values to be dropped during indexing
)

コレクションを作成

前の2つの手順で構成したコレクションスキーマとインデックスを使用して、demoという名前のコレクションを作成します。

from pymilvus import MilvusClient

client.create_collection(
collection_name="hybrid_search_collection",
schema=schema,
index_params=index_params
)

データの挿入

疎密度ベクトルをコレクションのdemoに挿入します。

from pymilvus import MilvusClient

data=[
{"id": 0, "text": "Artificial intelligence was founded as an academic discipline in 1956.", "sparse":{9637: 0.30856525997853057, 4399: 0.19771651149001523, ...}, "dense": [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, ...]},
{"id": 1, "text": "Alan Turing was the first person to conduct substantial research in AI.", "sparse":{6959: 0.31025067641541815, 1729: 0.8265339135915016, ...}, "dense": [0.19886812562848388, 0.06023560599112088, 0.6976963061752597, ...]},
{"id": 2, "text": "Born in Maida Vale, London, Turing was raised in southern England.", "sparse":{1220: 0.15303302147479103, 7335: 0.9436728846033107, ...}, "dense": [0.43742130801983836, -0.5597502546264526, 0.6457887650909682, ...]}

res = client.insert(
collection_name="hybrid_search_collection",
data=data
)

複数のAnn SearchRequestインスタンスを作成

ハイブリッド検索は、複数のAnnSearchRequesthybrid_search()関数で作成することによって実装されます。各AnnSearchRequestは、特定のベクトル場に対する基本的なANN検索要求を表します。したがって、ハイブリッド検索を実行する前に、各ベクトル場に対してAnnSearchRequestを作成する必要があります。

An SearchRequestでexprパラメータを設定することで、ハイブリッド検索のフィルタリング条件を設定できます。詳しくは、フィルター検索フィルタリングを参照してください。

📘ノート

ハイブリッド検索では、各An SearchRequestは1つのクエリベクトルのみをサポートします。

クエリテキスト「AI研究を始めたのは誰ですか?」がすでに疎ベクトルと密ベクトルに変換されているとします。これに基づいて、次の例に示すように、2つのAnn SearchRequest検索リクエストがそれぞれベクトルフィールドとベクトルフィールドに対して作成されます。

from pymilvus import AnnSearchRequest

query_dense_vector = [0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]

search_param_1 = {
"data": [query_dense_vector],
"anns_field": "dense",
"param": {
"metric_type": "IP",
"params": {"nprobe": 10}
},
"limit": 2
}
request_1 = AnnSearchRequest(**search_param_1)

query_sparse_vector = {3573: 0.34701499565746674}, {5263: 0.2639375518635271}
search_param_2 = {
"data": [query_sparse_vector],
"anns_field": "sparse",
"param": {
"metric_type": "IP",
"params": {"drop_ratio_build": 0.2}
},
"limit": 2
}
request_2 = AnnSearchRequest(**search_param_2)

reqs = [request_1, request_2]

パラメータの制限が2に設定されているため、各An SearchRequestは2つの検索結果を返します。この例では、2つのAn SearchRequestが作成されるため、合計4つの検索結果が返されます。

リランキング戦略を設定する

2つのANN検索結果をマージして再ランキングするには、適切な再ランキング戦略を選択する必要があります。Zilliz Cloudは、WeightedRankerRRFRankerの2種類の再ランキング戦略をサポートしています。再ランキング戦略を選択する際に考慮すべきことは、ベクトル場に対して1つ以上の基本的なANN検索に重点が置かれているかどうかです。

  • WeightedRanker:この戦略は、特定のベクトルフィールドを強調する必要がある場合に推奨されます。WeightedRankerを使用すると、特定のベクトルフィールドにより高い重みを割り当て、それらをより強調することができます。たとえば、マルチモーダル検索では、画像のテキストの説明が、この画像の色よりも重要と考えられる場合があります。

  • RRFRanker(Reciprocal Rank Fusion Ranker):この戦略は、特定の強調がない場合に推奨されます。RRFは、各ベクトル場の重要性を効果的にバランスさせることができます。

これら2つのリランキング戦略のメカニズムの詳細については、「リランキング」を参照してください。

次の2つの例は、WeightedRankerとRRFRankerの再ランキング戦略の使用方法を示しています。

  1. 例1: WeightedRankerの使用

    WeightedRanker戦略を使用する場合、WeightedRanker関数に重み値を入力する必要があります。ハイブリッド検索の基本ANN検索の数は、入力する必要がある値の数に対応します。入力値は[0,1]の範囲内であり、1に近い値ほど重要度が高いことを示します。

    from pymilvus import WeightedRanker

    rerank= WeightedRanker(0.8, 0.3)
  2. 例2: RRFRankerを使用する

    RRFRanker戦略を使用する場合、RRFRankerにパラメータ値kを入力する必要があります。kのデフォルト値は60です。このパラメータは、異なるANN検索からランクがどのように結合されるかを決定し、すべての検索で重要度をバランス良くブレンドするのに役立ちます。

    from pymilvus import RRFRanker

    ranker = RRFRanker(100)

Hybrid Searchを実行する前に、コレクションをメモリにロードする必要があります。コレクション内のベクトル場にインデックスがない場合やロードされていない場合、Hybrid Searchメソッドを呼び出すとエラーが発生します。

from pymilvus import MilvusClient

res = client.hybrid_search(
collection_name="hybrid_search_collection",
reqs=reqs,
ranker=ranker,
limit=2
)
for hits in res:
print("TopK results:")
for hit in hits:
print(hit)

以下が出力です:

["['id: 844, distance: 0.006047376897186041, entity: {}', 'id: 876, distance: 0.006422005593776703, entity: {}']"]

ハイブリッド検索でlimit=2が指定されているため、Zilliz Cloudはステップ3の4つの検索結果を再ランク付けし、最終的に最も類似した上位2つの検索結果のみを返します。