メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

ジオメトリフィールド

地理情報システム (GIS)、マッピングツール、位置情報ベースのサービスなどのアプリケーションを構築する際には、ジオメトリデータを保存およびクエリする必要がよくあります。Milvus の GEOMETRY データ型は、柔軟なジオメトリデータをネイティブに保存・クエリする方法を提供することで、この課題を解決します。

ベクトル類似性と空間制約を組み合わせる必要がある場合は、GEOMETRY フィールドを使用します。例えば以下のようなケースです:

  • 位置情報ベースサービス (LBS):「この街区にある類似のPOIを検索」

  • マルチモーダル検索:「この地点から1km以内にある類似の写真を取得」

  • 地図・物流:「ある地域の資産」または「ある経路と交差するルート」

📘Notes

GEOMETRY フィールドを使用するには、SDK を最新バージョンにアップグレードしてください。

GEOMETRY フィールドとは?

GEOMETRY フィールドは、Zilliz Cloud におけるスキーマ定義済みのデータ型(データType.GEOMETRY)で、ジオメトリデータを格納します。ジオメトリフィールドを操作する際には、データの挿入およびクエリの両方で Well-Known Text (WKT) 形式を使用します。これは人間が読みやすい表現形式です。内部的には、Zilliz Cloud が WKT を効率的な保存・処理のために Well-Known Binary (WKB) に変換しますが、ユーザーが WKB を直接扱う必要はありません。

GEOMETRY データ型は以下のジオメトリオブジェクトをサポートしています:

  • POINT: POINT (x y);例:POINT (13.403683 52.520711)x = 経度、y = 緯度)

  • LINESTRING: LINESTRING (x1 y1, x2 y2, …);例:LINESTRING (13.40 52.52, 13.41 52.51)

  • POLYGON: POLYGON ((x1 y1, x2 y2, x3 y3, x1 y1));例:POLYGON ((30 10, 40 40, 20 40, 10 20, 30 10))

  • MULTIPOINT: MULTIPOINT ((x1 y1), (x2 y2), …);例:MULTIPOINT ((10 40), (40 30), (20 20), (30 10))

  • MULTILINESTRING: MULTILINESTRING ((x1 y1, …), (xk yk, …));例:MULTILINESTRING ((10 10, 20 20, 10 40), (40 40, 30 30, 40 20, 30 10))

  • MULTIPOLYGON: MULTIPOLYGON (((outer ring ...)), ((outer ring ...)));例:MULTIPOLYGON (((30 20, 45 40, 10 40, 30 20)), ((15 5, 40 10, 10 20, 5 10, 15 5)))

  • GEOMETRYCOLLECTION: GEOMETRYCOLLECTION(POINT(x y), LINESTRING(x1 y1, x2 y2), ...);例:GEOMETRYCOLLECTION (POINT (40 10), LINESTRING (10 10, 20 20, 10 40), POLYGON ((40 40, 20 45, 45 30, 40 40)))

基本操作

GEOMETRY フィールドのワークフローには、コレクションスキーマでの定義、ジオメトリデータの挿入、そして特定のフィルター式を使用したデータのクエリが含まれます。

ステップ 1: GEOMETRY フィールドの定義

GEOMETRY フィールドを使用するには、コレクション作成時に明示的にコレクションスキーマ内で定義する必要があります。以下の例では、geo フィールドを データType.GEOMETRY 型として持つコレクションを作成する方法を示しています。

from pymilvus import MilvusClient, DataType
import numpy as np

dim = 8
collection_name = "geo_collection"
milvus_client = MilvusClient("YOUR_CLUSTER_ENDPOINT")

# Create schema with a GEOMETRY field
schema = milvus_client.create_schema(enable_dynamic_field=True)
schema.add_field("id", DataType.INT64, is_primary=True)
schema.add_field("embeddings", DataType.FLOAT_VECTOR, dim=dim)
schema.add_field("geo", DataType.GEOMETRY, nullable=True)
schema.add_field("name", DataType.VARCHAR, max_length=128)

milvus_client.create_collection(collection_name, schema=schema, consistency_level="Strong")
📘Notes

この例では、コレクションスキーマで定義された GEOMETRY フィールドが nullable=True により NULL 許容となっています。詳細については、NULL許容 & デフォルト値 を参照してください。

Step 2: Insert data

WKT 形式のジオメトリデータを含むエンティティを挿入します。以下は複数の地理ポイントを含む例です:

rng = np.random.default_rng(seed=19530)
geo_points = [
'POINT(13.399710 52.518010)',
'POINT(13.403934 52.522877)',
'POINT(13.405088 52.521124)',
'POINT(13.408223 52.516876)',
'POINT(13.400092 52.521507)',
'POINT(13.408529 52.519274)',
]

rows = [
{"id": 1, "name": "Shop A", "embeddings": rng.random((1, dim))[0], "geo": geo_points[0]},
{"id": 2, "name": "Shop B", "embeddings": rng.random((1, dim))[0], "geo": geo_points[1]},
{"id": 3, "name": "Shop C", "embeddings": rng.random((1, dim))[0], "geo": geo_points[2]},
{"id": 4, "name": "Shop D", "embeddings": rng.random((1, dim))[0], "geo": geo_points[3]},
{"id": 5, "name": "Shop E", "embeddings": rng.random((1, dim))[0], "geo": geo_points[4]},
{"id": 6, "name": "Shop F", "embeddings": rng.random((1, dim))[0], "geo": geo_points[5]},
]

insert_result = milvus_client.insert(collection_name, rows)
print(insert_result)

# Expected output:
# {'insert_count': 6, 'ids': [1, 2, 3, 4, 5, 6]}

ステップ 3: フィルタリング操作

GEOMETRY フィールドに対してフィルタリング操作を実行する前に、以下の点を確認してください。

  • 各ベクターフィールドにインデックスを作成済みであること。

  • コレクションがメモリにロード済みであること。

コードを表示
index_params = milvus_client.prepare_index_params()
index_params.add_index(field_name="embeddings", metric_type="L2")

milvus_client.create_index(collection_name, index_params)
milvus_client.load_collection(collection_name)

これらの要件を満たせば、専用のジオメトリ演算子を使用した式で、ジオメトリ値に基づいてコレクションをフィルタリングできます。

フィルター式の定義

GEOMETRY フィールドでフィルタリングするには、式内でジオメトリ演算子を使用します:

  • 一般: {operator}(geo_field, '{wkt}')

  • 距離ベース: ST_DWITHIN(geo_field, '{wkt}', distance)

ここで:

  • operator はサポートされているジオメトリ演算子のいずれか(例:ST_CONTAINS, ST_INTERSECTS)です。演算子名はすべて大文字またはすべて小文字で記述する必要があります。サポートされている演算子の一覧については、Supported geometry operators を参照してください。

  • geo_fieldGEOMETRY フィールドの名前です。

  • '{wkt}' はクエリ対象ジオメトリの WKT 表現です。

  • distanceST_DWITHIN 専用の距離しきい値です。

以下の例では、さまざまなジオメトリ固有の演算子をフィルター式で使用する方法を示します:

例 1: 矩形領域内に存在するエンティティを検索

top_left_lon, top_left_lat = 13.403683, 52.520711
bottom_right_lon, bottom_right_lat = 13.455868, 52.495862
bounding_box_wkt = f"POLYGON(({top_left_lon} {top_left_lat}, {bottom_right_lon} {top_left_lat}, {bottom_right_lon} {bottom_right_lat}, {top_left_lon} {bottom_right_lat}, {top_left_lon} {top_left_lat}))"

query_results = milvus_client.query(
collection_name,
filter=f"st_within(geo, '{bounding_box_wkt}')",
output_fields=["name", "geo"]
)
for ret in query_results:
print(ret)

# Expected output:
# {'name': 'Shop D', 'geo': 'POINT (13.408223 52.516876)', 'id': 4}
# {'name': 'Shop F', 'geo': 'POINT (13.408529 52.519274)', 'id': 6}
# {'name': 'Shop A', 'geo': 'POINT (13.39971 52.51801)', 'id': 1}
# {'name': 'Shop B', 'geo': 'POINT (13.403934 52.522877)', 'id': 2}
# {'name': 'Shop C', 'geo': 'POINT (13.405088 52.521124)', 'id': 3}
# {'name': 'Shop D', 'geo': 'POINT (13.408223 52.516876)', 'id': 4}
# {'name': 'Shop E', 'geo': 'POINT (13.400092 52.521507)', 'id': 5}
# {'name': 'Shop F', 'geo': 'POINT (13.408529 52.519274)', 'id': 6}

例2: 中心点から1km以内のエンティティを検索する

center_point_lon, center_point_lat = 13.403683, 52.520711
radius_meters = 1000.0
central_point_wkt = f"POINT({center_point_lon} {center_point_lat})"

query_results = milvus_client.query(
collection_name,
filter=f"st_dwithin(geo, '{central_point_wkt}', {radius_meters})",
output_fields=["name", "geo"]
)
for ret in query_results:
print(ret)

# Expected output:
# hit: {'id': 4, 'distance': 0.9823770523071289, 'entity': {'name': 'Shop D', 'geo': 'POINT (13.408223 52.516876)'}}

例3: ベクトル類似性と空間フィルターを組み合わせる

vectors_to_search = rng.random((1, dim))
result = milvus_client.search(
collection_name,
vectors_to_search,
limit=3,
output_fields=["name", "geo"],
filter=f"st_within(geo, '{bounding_box_wkt}')"
)
for hits in result:
for hit in hits:
print(f"hit: {hit}")

# Expected output:
# hit: {'id': 6, 'distance': 1.3406795263290405, 'entity': {'name': 'Shop F', 'geo': 'POINT (13.408529 52.519274)'}}

次のステップ: クエリの高速化

インデックスが設定されていない GEOMETRY フィールドに対するクエリは、デフォルトで全行をスキャンするため、大規模なデータセットでは遅くなる可能性があります。幾何学的クエリを高速化するには、GEOMETRY フィールドに AUTOINDEX インデックスを作成してください。

詳細については、スカラー フィールドのインデックス作成を参照してください。

FAQ

コレクションで動的フィールド機能を有効にしている場合、動的フィールドキーに幾何学的データを挿入できますか?

いいえ、幾何学的データを動的フィールドに挿入することはできません。幾何学的データを挿入する前に、コレクションスキーマ内で GEOMETRY フィールドが明示的に定義されていることを確認してください。

GEOMETRY フィールドは mmap 機能をサポートしていますか?

はい、GEOMETRY フィールドは mmap をサポートしています。詳細については、mmap の使用を参照してください。

GEOMETRY フィールドを NULL 許容にしたり、デフォルト値を設定したりできますか?

はい、GEOMETRY フィールドは nullable 属性と WKT 形式でのデフォルト値をサポートしています。詳細については、NULL 許容 & デフォルト値を参照してください。