メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

TIMESTAMPTZ フィールド

eコマースシステム、コラボレーションツール、分散型ロギングなど、複数の地域にわたって時刻を追跡するアプリケーションでは、タイムゾーン付きのタイムスタンプを正確に扱う必要があります。Zilliz Cloud の TIMESTAMPTZ データ型は、タイムゾーン情報を含むタイムスタンプを格納することで、この要件に対応します。

TIMESTAMPTZ フィールドとは?

TIMESTAMPTZ フィールドは、Zilliz Cloud におけるスキーマ定義済みのデータ型(DataType.TIMESTAMPTZ)であり、タイムゾーンを考慮した入力を処理し、すべての時刻を内部的に UTC の絶対時刻として格納します。

  • 許容される入力形式: TIMESTAMPTZ フィールドは ISO 8601 互換のタイムスタンプ文字列を受け入れます。例:

    • "2024-12-31 22:00:00"

    • "2024-12-31T22:00:00"

    • "2024-12-31T22:00:00+08:00"

    • "2024-12-31T22:00:00Z"

  • タイムスタンプのパースルール: タイムスタンプの解釈方法は、入力文字列に明示的にタイムゾーンが指定されているかどうかにより異なります。

    • 入力にタイムゾーンオフセット(例: +08:00Z)が含まれている場合、その値は絶対時刻として扱われます。

    • 入力にタイムゾーンオフセットが含まれていない場合、コレクションに設定されたタイムゾーンに基づいて解釈されます。たとえば、コレクションのタイムゾーンが Asia/Shanghai の場合:

      • "2024-12-31 22:00:00"2024-12-31T22:00:00+08:00 として解釈されます。

      • "2024-12-31T22:00:00"2024-12-31T22:00:00Z として解釈され、これは 2025-01-01T06:00:00+08:00 に相当します。

  • 内部ストレージ: すべての TIMESTAMPTZ 値は正規化され、協定世界時(UTC)で格納されます。

  • 比較とフィルタリング: TIMESTAMPTZ フィールドに対するすべての比較・フィルタリング・並べ替え操作は、UTC 正規化後の値に対して実行されるため、異なるタイムゾーン間でも一貫した動作が保証されます。

📘Notes
  • TIMESTAMPTZ フィールドには nullable=True を設定して、欠損値を許容できます。

  • ISO 8601 形式で default_value 属性を使用してデフォルトのタイムスタンプ値を指定できます。

詳細については、NULL許容 & デフォルト値を参照してください。

基本的な操作

TIMESTAMPTZ フィールドの基本的なワークフローは、Zilliz Cloud の他のスカラーフィールドと同様です:フィールドを定義 → データを挿入 → クエリ/フィルタリング。

ステップ 1: TIMESTAMPTZ フィールドを定義する

TIMESTAMPTZ フィールドを使用するには、コレクション作成時にスキーマ内で明示的に定義する必要があります。以下の例では、DataType.TIMESTAMPTZ 型の tsz フィールドを持つコレクションを作成する方法を示しています。

import time
from pymilvus import MilvusClient, DataType
import datetime
import pytz

server_address = "YOUR_CLUSTER_ENDPOINT"
collection_name = "timestamptz_test123"

client = MilvusClient(uri=server_address)

if client.has_collection(collection_name):
client.drop_collection(collection_name)

schema = client.create_schema()
# Add a primary key field
schema.add_field("id", DataType.INT64, is_primary=True)
# Add a TIMESTAMPTZ field that allows null values
schema.add_field("tsz", DataType.TIMESTAMPTZ, nullable=True)
# Add a vector field
schema.add_field("vec", DataType.FLOAT_VECTOR, dim=4)

client.create_collection(collection_name, schema=schema, consistency_level="Session")
print(f"Collection '{collection_name}' with a TimestampTz field created successfully.")

Step 2: Insert data

タイムゾーンオフセット付きの ISO 8601 文字列を含むエンティティを挿入します。

以下の例では、サンプルデータの 8,193 行をコレクションに挿入します。各行には以下が含まれます:

  • ユニークな ID

  • タイムゾーン情報を含むタイムスタンプ(上海時間)

  • 単純な 4 次元ベクトル

data_size = 10

# Get the Asia/Shanghai time zone using the pytz library
# You can use any valid IANA time zone identifier such as:
# "Asia/Tokyo", "America/New_York", "Europe/London", "UTC", etc.
# To view all available values:
# import pytz; print(pytz.all_timezones)
# Reference:
# IANA database – https://www.iana.org/time-zones
# Wikipedia – https://en.wikipedia.org/wiki/List_of_tz_database_time_zones
shanghai_tz = pytz.timezone("Asia/Shanghai")

data = [
{
"id": i + 1,
"tsz": shanghai_tz.localize(
datetime.datetime(2025, 1, 1, 0, 0, 0) + datetime.timedelta(days=i)
).isoformat(),
"vec": [float(i) / 10 for i in range(4)],
}
for i in range(data_size)
]

client.insert(collection_name, data)
print("Data inserted successfully.")

ステップ 3: フィルタリング操作

TIMESTAMPTZ はスカラー比較、間隔演算、および時間コンポーネントの抽出をサポートしています。

TIMESTAMPTZ フィールドに対してフィルタリング操作を実行する前に、以下の点を確認してください。

  • 各ベクターフィールドにインデックスを作成済みであること。

  • コレクションがメモリにロード済みであること。

コード例を表示
# Create index on vector field
index_params = client.prepare_index_params()
index_params.add_index(
field_name="vec",
index_type="AUTOINDEX",
index_name="vec_index",
metric_type="COSINE"
)
client.create_index(collection_name, index_params)
print("Index created successfully.")

# Load the collection
client.load_collection(collection_name)
print(f"Collection '{collection_name}' loaded successfully.")

タイムスタンプフィルタリングによるクエリ

==!=<><=>= のような算術演算子を使用します。Zilliz Cloud で利用可能な算術演算子の完全なリストについては、算術演算子 を参照してください。

📘Notes

連鎖範囲式(例: lower_bound < tsz < upper_bound)はサポートされていません。

代わりに論理積を使用してください: tsz > lower_bound AND tsz < upper_bound

以下の例では、タイムスタンプ(tsz)が 2025-01-03T00:00:00+08:00 と等しくないエンティティをフィルタリングします:

# Query for entities where tsz is not equal to '2025-01-03T00:00:00+08:00'
expr = "tsz != ISO '2025-01-03T00:00:00+08:00'"

results = client.query(
collection_name=collection_name,
filter=expr,
output_fields=["id", "tsz"],
limit=10
)

print("Query result: ", results)

# Expected output:
# Query result: data: ["{'id': 1, 'tsz': '2024-12-31T16:00:00Z'}", "{'id': 2, 'tsz': '2025-01-01T16:00:00Z'}", "{'id': 4, 'tsz': '2025-01-03T16:00:00Z'}", "{'id': 5, 'tsz': '2025-01-04T16:00:00Z'}", "{'id': 6, 'tsz': '2025-01-05T16:00:00Z'}", "{'id': 7, 'tsz': '2025-01-06T16:00:00Z'}", "{'id': 8, 'tsz': '2025-01-07T16:00:00Z'}", "{'id': 9, 'tsz': '2025-01-08T16:00:00Z'}", "{'id': 10, 'tsz': '2025-01-09T16:00:00Z'}", "{'id': 11, 'tsz': '2025-01-10T16:00:00Z'}"]

上記の例では、

  • tsz はスキーマで定義された TIMESTAMPTZ フィールド名です。

  • ISO '2025-01-03T00:00:00+08:00' はタイムゾーンオフセットを含む ISO 8601 形式のタイムスタンプリテラルです。

  • != はフィールド値とそのリテラルを比較します。その他のサポートされている演算子には、==<<=>>= があります。

Interval operations

ISO 8601 duration formatINTERVAL 値を使用して、TIMESTAMPTZ フィールドに対して算術演算を実行できます。これにより、データをフィルタリングする際に、日数、時間、分などの期間をタイムスタンプに加算または減算できます。

たとえば、次のクエリは、タイムスタンプ(tsz)にゼロ日を加算した値が 2025-01-03T00:00:00+08:00等しくないエンティティをフィルタリングします:

expr = "tsz + INTERVAL 'P0D' != ISO '2025-01-03T00:00:00+08:00'"

results = client.query(
collection_name,
filter=expr,
output_fields=["id", "tsz"],
limit=10
)

print("Query result: ", results)

# Expected output:
# Query result: data: ["{'id': 1, 'tsz': '2024-12-31T16:00:00Z'}", "{'id': 2, 'tsz': '2025-01-01T16:00:00Z'}", "{'id': 4, 'tsz': '2025-01-03T16:00:00Z'}", "{'id': 5, 'tsz': '2025-01-04T16:00:00Z'}", "{'id': 6, 'tsz': '2025-01-05T16:00:00Z'}", "{'id': 7, 'tsz': '2025-01-06T16:00:00Z'}", "{'id': 8, 'tsz': '2025-01-07T16:00:00Z'}", "{'id': 9, 'tsz': '2025-01-08T16:00:00Z'}", "{'id': 10, 'tsz': '2025-01-09T16:00:00Z'}", "{'id': 11, 'tsz': '2025-01-10T16:00:00Z'}"]
📘Notes

INTERVAL 値は ISO 8601 duration 構文 に従います。例:

  • P1D → 1 日

  • PT3H → 3 時間

  • P2DT6H → 2 日と 6 時間

フィルター式内で直接 INTERVAL 演算を使用できます。例:

  • tsz + INTERVAL 'P3D' → 3 日を加算

  • tsz - INTERVAL 'PT2H' → 2 時間を減算

タイムスタンプによるフィルタリングを伴う検索

TIMESTAMPTZ フィルタリングとベクトル類似性検索を組み合わせて、時間と類似性の両方で結果を絞り込むことができます。

# Define a time-based filter expression
filter = "tsz > ISO '2025-01-05T00:00:00+08:00'"

res = client.search(
collection_name=collection_name, # Collection name
data=[[0.1, 0.2, 0.3, 0.4]], # Query vector (must match collection's vector dim)
limit=5, # Max. number of results to return
filter=filter, # Filter expression using TIMESTAMPTZ
output_fields=["id", "tsz"], # Fields to include in the search results
)

print("Search result: ", res)

# Expected output:
# Search result: data: [[{'id': 10, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-09T16:00:00Z', 'id': 10}}, {'id': 9, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-08T16:00:00Z', 'id': 9}}, {'id': 8, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-07T16:00:00Z', 'id': 8}}, {'id': 7, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-06T16:00:00Z', 'id': 7}}, {'id': 6, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-05T16:00:00Z', 'id': 6}}]]
📘Notes

コレクションに2つ以上のベクトルフィールドがある場合、タイムスタンプフィルタリングを用いたハイブリッド検索操作を実行できます。詳細については、Multi-Vector Hybrid Search を参照してください。

Advanced usage

高度な使用方法として、異なるレベル(データベース、コレクション、クエリなど)でタイムゾーンを管理したり、インデックスを使用して TIMESTAMPTZ フィールドに対するクエリの高速化を行ったりできます。

Manage time zones at different levels

TIMESTAMPTZ フィールドのタイムゾーンは、コレクションレベルまたはクエリ/検索レベルで制御できます。

Level

Parameter

Scope

Priority

Collection

timezone

そのコレクションに対して、データベースのデフォルトタイムゾーン設定を上書きします

Query/search/hybrid search

timezone

特定の1回の操作に対して一時的に上書きします

Highest

ステップバイステップの手順およびコードサンプルについては、以下の専用ページを参照してください:

クエリの高速化

デフォルトでは、インデックスを持たない TIMESTAMPTZ フィールドに対するクエリは全行スキャンを実行するため、大規模なデータセットでは遅くなる可能性があります。タイムスタンプクエリを高速化するには、TIMESTAMPTZ フィールドに対して AUTOINDEX インデックスを作成してください。

詳細については、Index Scalar Fields を参照してください。