メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

Search Iterator

ANN検索には、1回のクエリで再呼び出し(recall)できるエンティティ数の上限があり、基本的なANN検索だけでは大規模な検索要件を満たせない場合があります。topKが16,384を超えるANN検索リクエストでは、SearchIteratorの使用を検討することをお勧めします。このセクションでは、SearchIteratorの使い方と関連する注意点を紹介します。

概要

通常のSearchリクエストは検索結果を返しますが、SearchIteratorはイテレータを返します。このイテレータの next() メソッドを呼び出すことで、検索結果を取得できます。

具体的には、SearchIteratorは次のように使用します。

  1. SearchIteratorを作成し、1回の検索リクエストで返すエンティティ数および合計で返すエンティティ数を設定します。

  2. SearchIteratorの next() メソッドをループ内で呼び出して、検索結果をページネーション形式で取得します。

  3. next() メソッドが空の結果を返した場合は、イテレータの close() メソッドを呼び出してループを終了します。

SearchIteratorの作成

以下のコードスニペットは、SearchIteratorの作成方法を示しています。

from pymilvus import MilvusClient

client = MilvusClient(
uri="YOUR_CLUSTER_ENDPOINT",
token="YOUR_CLUSTER_TOKEN"
)

# create iterator
query_vectors = [
[0.3580376395471989, -0.6023495712049978, 0.18414012509913835, -0.26286205330961354, 0.9029438446296592]]

iterator = client.search_iterator(
collection_name="iterator_collection"
data=query_vectors,
anns_field="vector",
search_param={"metric_type": "L2", "params": {"nprobe": 16}},
batch_size=50,
output_fields=["color"],
limit=20000
)

上記の例では、1回の検索で返されるエンティティ数(batch_size/batchSize)を50に、返されるエンティティの総数(topK)を20,000に設定しています。

Use SearchIterator

SearchIteratorの準備が完了したら、そのnext()メソッドを呼び出して、検索結果をページネーション形式で取得できます。

while True:
result = iterator.next()
if not result:
iterator.close()
break

for res in result:
print(res)

上記のコード例では、無限ループを作成し、そのループ内で next() メソッドを呼び出して検索結果を変数に格納しています。また、next() が何も返さなくなった時点でイテレータを閉じています。