メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

TIMESTAMPTZ フィールド

地域をまたがる時間を追跡するアプリケーション(例:eコマースシステム、コラボレーションツール、分散ログ)では、タイムゾーン付きタイムスタンプの正確な処理が必要です。Zilliz Cloud の TIMESTAMPTZ データ型は、タイムゾーンに関連付けられたタイムスタンプを保存することで、この機能を提供します。

TIMESTAMPTZ フィールドとは何ですか?

TIMESTAMPTZ フィールドは、Zilliz Cloud でのスキーマ定義データ型(データType.TIMESTAMPTZ)であり、タイムゾーン対応の入力を処理し、すべての時点を内部的に UTC 絶対時間として保存します:

  • 許容される入力形式: TIMESTAMPTZ フィールドは ISO 8601 互換のタイムスタンプ文字列を受け入れます。以下を含みます:

    • "2024-12-31 22:00:00"

    • "2024-12-31T22:00:00"

    • "2024-12-31T22:00:00+08:00"

    • "2024-12-31T22:00:00Z"

  • タイムスタンプのパースルール: タイムスタンプの解釈方法は、入力文字列がタイムゾーンを明示的に指定しているかどうかによって異なります:

    • 入力にタイムゾーンオフセットが含まれている場合(例:+08:00 または Z)、絶対時点として扱われます。

    • 入力にタイムゾーンオフセットが含まれていない場合、コレクションの設定されたタイムゾーンを使用して解釈されます。例えば、コレクションのタイムゾーンが Asia/Shanghai の場合:

      • "2024-12-31 22:00:00"2024-12-31T22:00:00+08:00 として解釈されます

      • "2024-12-31T22:00:00"2024-12-31T22:00:00Z として解釈され、これは 2025-01-01T06:00:00+08:00 に相当します

  • 内部ストレージ: すべての TIMESTAMPTZ 値は正規化され、協定世界時(UTC)で保存されます。

  • 比較とフィルタリング: TIMESTAMPTZ フィールドに対するすべての比較、フィルタリング、および順序付け操作は、UTC 正規化された値に対して実行されるため、異なるタイムゾーン間で一貫した動作が保証されます。

📘Notes
  • TIMESTAMPTZ フィールドに対して nullable=True を設定することで、欠損値を許容できます。

  • default_value 属性を使用して、ISO 8601 形式でデフォルトのタイムスタンプ値を指定できます。

詳細については、NULL許容 & デフォルト を参照してください。

基本操作

TIMESTAMPTZ フィールドを使用する基本的なワークフローは、Zilliz Cloud の他のスカラーフィールドと同様です:フィールドを定義する → データを挿入する → クエリ/フィルタリングする。

ステップ 1: TIMESTAMPTZ フィールドを定義する

TIMESTAMPTZ フィールドを使用するには、コレクションの作成時にコレクションスキーマで明示的に定義します。以下の例は、データType.TIMESTAMPTZ 型の tsz フィールドを持つコレクションを作成する方法を示しています。

import time
from pymilvus import MilvusClient, DataType
import datetime
import pytz

server_address = "YOUR_CLUSTER_ENDPOINT"
collection_name = "timestamptz_test123"

client = MilvusClient(uri=server_address)

if client.has_collection(collection_name):
client.drop_collection(collection_name)

schema = client.create_schema()
# Add a primary key field
schema.add_field("id", DataType.INT64, is_primary=True)
# Add a TIMESTAMPTZ field that allows null values
schema.add_field("tsz", DataType.TIMESTAMPTZ, nullable=True)
# Add a vector field
schema.add_field("vec", DataType.FLOAT_VECTOR, dim=4)

client.create_collection(collection_name, schema=schema, consistency_level="Session")
print(f"Collection '{collection_name}' with a TimestampTz field created successfully.")

Step 2: Insert data

タイムゾーンオフセット付きの ISO 8601 文字列を含むエンティティを挿入します。

以下の例では、サンプルデータの 8,193 行をコレクションに挿入します。各行には以下が含まれます:

  • ユニークな ID

  • タイムゾーン情報を含むタイムスタンプ(上海時間)

  • 単純な 4 次元ベクトル

data_size = 10

# Get the Asia/Shanghai time zone using the pytz library
# You can use any valid IANA time zone identifier such as:
# "Asia/Tokyo", "America/New_York", "Europe/London", "UTC", etc.
# To view all available values:
# import pytz; print(pytz.all_timezones)
# Reference:
# IANA database – https://www.iana.org/time-zones
# Wikipedia – https://en.wikipedia.org/wiki/List_of_tz_database_time_zones
shanghai_tz = pytz.timezone("Asia/Shanghai")

data = [
{
"id": i + 1,
"tsz": shanghai_tz.localize(
datetime.datetime(2025, 1, 1, 0, 0, 0) + datetime.timedelta(days=i)
).isoformat(),
"vec": [float(i) / 10 for i in range(4)],
}
for i in range(data_size)
]

client.insert(collection_name, data)
print("Data inserted successfully.")

ステップ 3: フィルタリング操作

TIMESTAMPTZ はスカラー比較、間隔演算、および時間コンポーネントの抽出をサポートしています。

TIMESTAMPTZ フィールドに対してフィルタリング操作を実行する前に、以下の点を確認してください。

  • 各ベクターフィールドにインデックスを作成済みであること。

  • コレクションがメモリにロード済みであること。

コード例を表示
# Create index on vector field
index_params = client.prepare_index_params()
index_params.add_index(
field_name="vec",
index_type="AUTOINDEX",
index_name="vec_index",
metric_type="COSINE"
)
client.create_index(collection_name, index_params)
print("Index created successfully.")

# Load the collection
client.load_collection(collection_name)
print(f"Collection '{collection_name}' loaded successfully.")

タイムスタンプフィルタリングを使用したクエリ

==!=<><=>= などの算術演算子を使用します。Zilliz Cloud で使用可能な算術演算子の完全なリストについては、算術演算子 を参照してください。

📘Notes

連鎖した範囲式(例: lower_bound < tsz < upper_bound)はサポートされていません。

代わりに論理積を使用してください: tsz > lower_bound AND tsz < upper_bound

以下の例では、タイムスタンプ(tsz)が 2025-01-03T00:00:00+08:00 と等しくないエンティティをフィルタリングします:

# Query for entities where tsz is not equal to '2025-01-03T00:00:00+08:00'
expr = "tsz != ISO '2025-01-03T00:00:00+08:00'"

results = client.query(
collection_name=collection_name,
filter=expr,
output_fields=["id", "tsz"],
limit=10
)

print("Query result: ", results)

# Expected output:
# Query result: data: ["{'id': 1, 'tsz': '2024-12-31T16:00:00Z'}", "{'id': 2, 'tsz': '2025-01-01T16:00:00Z'}", "{'id': 4, 'tsz': '2025-01-03T16:00:00Z'}", "{'id': 5, 'tsz': '2025-01-04T16:00:00Z'}", "{'id': 6, 'tsz': '2025-01-05T16:00:00Z'}", "{'id': 7, 'tsz': '2025-01-06T16:00:00Z'}", "{'id': 8, 'tsz': '2025-01-07T16:00:00Z'}", "{'id': 9, 'tsz': '2025-01-08T16:00:00Z'}", "{'id': 10, 'tsz': '2025-01-09T16:00:00Z'}", "{'id': 11, 'tsz': '2025-01-10T16:00:00Z'}"]

上記の例では、

  • tsz はスキーマで定義された TIMESTAMPTZ フィールド名です。

  • ISO '2025-01-03T00:00:00+08:00'ISO 8601 形式のタイムスタンプリテラルで、タイムゾーンオフセットを含みます。

  • != はフィールド値とそのリテラルを比較します。他にサポートされている演算子には ==<<=>>= があります。

Interval operations

ISO 8601 duration formatINTERVAL 値を使用して、TIMESTAMPTZ フィールドに対する演算を実行できます。これにより、データをフィルタリングする際に、タイムスタンプに日、時間、分などの期間を加算または減算できます。

たとえば、次のクエリは、タイムスタンプ (tsz) にゼロ日を加算した値が 2025-01-03T00:00:00+08:00等しくないエンティティをフィルタリングします。

expr = "tsz + INTERVAL 'P0D' != ISO '2025-01-03T00:00:00+08:00'"

results = client.query(
collection_name,
filter=expr,
output_fields=["id", "tsz"],
limit=10
)

print("Query result: ", results)

# Expected output:
# Query result: data: ["{'id': 1, 'tsz': '2024-12-31T16:00:00Z'}", "{'id': 2, 'tsz': '2025-01-01T16:00:00Z'}", "{'id': 4, 'tsz': '2025-01-03T16:00:00Z'}", "{'id': 5, 'tsz': '2025-01-04T16:00:00Z'}", "{'id': 6, 'tsz': '2025-01-05T16:00:00Z'}", "{'id': 7, 'tsz': '2025-01-06T16:00:00Z'}", "{'id': 8, 'tsz': '2025-01-07T16:00:00Z'}", "{'id': 9, 'tsz': '2025-01-08T16:00:00Z'}", "{'id': 10, 'tsz': '2025-01-09T16:00:00Z'}", "{'id': 11, 'tsz': '2025-01-10T16:00:00Z'}"]
📘Notes

INTERVAL 値は ISO 8601 duration 構文 に従います。例:

  • P1D → 1 日

  • PT3H → 3 時間

  • P2DT6H → 2 日と 6 時間

フィルター式内で直接 INTERVAL 演算を使用できます。例:

  • tsz + INTERVAL 'P3D' → 3 日を加算

  • tsz - INTERVAL 'PT2H' → 2 時間を減算

タイムスタンプによるフィルタリングを伴う検索

TIMESTAMPTZ フィルタリングとベクトル類似性検索を組み合わせて、時間と類似性の両方で結果を絞り込むことができます。

# Define a time-based filter expression
filter = "tsz > ISO '2025-01-05T00:00:00+08:00'"

res = client.search(
collection_name=collection_name, # Collection name
data=[[0.1, 0.2, 0.3, 0.4]], # Query vector (must match collection's vector dim)
limit=5, # Max. number of results to return
filter=filter, # Filter expression using TIMESTAMPTZ
output_fields=["id", "tsz"], # Fields to include in the search results
)

print("Search result: ", res)

# Expected output:
# Search result: data: [[{'id': 10, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-09T16:00:00Z', 'id': 10}}, {'id': 9, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-08T16:00:00Z', 'id': 9}}, {'id': 8, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-07T16:00:00Z', 'id': 8}}, {'id': 7, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-06T16:00:00Z', 'id': 7}}, {'id': 6, 'distance': 0.9759000539779663, 'entity': {'tsz': '2025-01-05T16:00:00Z', 'id': 6}}]]
📘Notes

コレクションに2つ以上のベクトルフィールドがある場合、タイムスタンプフィルタリングを使用したハイブリッド検索操作を実行できます。詳細については、マルチベクトルハイブリッド検索を参照してください。

高度な使用方法

高度な使用方法として、異なるレベル(データベース、コレクション、クエリなど)でタイムゾーンを管理したり、TIMESTAMPTZ フィールドにインデックスを作成してクエリの高速化を行うことができます。

異なるレベルでのタイムゾーン管理

コレクションレベルまたはクエリ/検索レベルで TIMESTAMPTZ フィールドのタイムゾーンを制御できます。

レベル

パラメータ

スコープ

優先度

コレクション

timezone

そのコレクションのデータベースデフォルトのタイムゾーン設定を上書き

クエリ/検索/ハイブリッド検索

timezone

1回の特定の操作に対する一時的な上書き

最高

ステップバイステップの手順とコードサンプルについては、専用のページを参照してください:

クエリの高速化

デフォルトでは、インデックスのない TIMESTAMPTZ フィールドに対するクエリは、すべての行をフルスキャンして実行されるため、大規模なデータセットでは遅くなる可能性があります。タイムスタンプクエリを高速化するには、TIMESTAMPTZ フィールドに AUTOINDEX インデックスを作成してください。

詳細については、スカラーフィールドのインデックス作成を参照してください。