バージョン: User Guides (Cloud)

[説明] このページは機械翻訳された日本語版です。内容に誤りがございましたら、報告していただけると助かります。

スキーマとデータフィールド

スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。

概要 [READ MORE]

スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を行う必要があります。このページでは、コレクションのスキーマを理解し、独自のスキーマ設計の例を作成するのに役立ちます。

プライマリフィールド [READ MORE]

Zilliz Cloud のすべてのコレクションには、各エンティティを一意に識別するプライマリフィールドが必要です。このフィールドにより、すべてのエンティティを曖昧さなく挿入、更新、クエリ、削除できます。

デンスベクトルは、機械学習やデータ分析で広く使用される数値データ表現です。実数からなる配列で、ほとんどまたはすべての要素が非ゼロです。疎ベクトルと比較して、デンスベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値が保持されています。この表現は複雑なパターンや関係性を効果的に捉えることができ、高次元空間でのデータの分析や処理を容易にします。デンスベクトルの次元数は通常固定されており、具体的なアプリケーションや要件に応じて数十から数百、場合によっては数千の範囲で変化します。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、ストレージと計算コストも削減されながら、セマンティック情報が保持されます。非重要な特徴量の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の完全性と有用性を効果的に維持できます。

疎ベクトル [READ MORE]

疎ベクトルは、情報検索や自然言語処理において表層的な用語の一致を捉える重要な手法です。密ベクトルは意味理解に優れていますが、疎ベクトルは特別な用語やテキスト識別子を検索する際に、より予測可能な一致結果を提供することが多いです。

文字列 [READ MORE]

Zilliz Cloud クラスタでは、`VARCHAR` は文字列データを格納するために使用されるデータ型です。

ブール値と数値 [READ MORE]

ブール値または数値フィールドは、ブール値または数値を格納するスカラーフィールドです。これらの値は、2つの可能な値のいずれか、または整数（整数）と小数（浮動小数点数）です。これらは通常、数量、測定値、または論理的または数学的に処理する必要があるデータを表すために使用されます。

JSON [READ MORE]

この章では、JSON フィールド型について紹介し、JSON フィールドのインデックス作成方法に関するガイドを提供します。

配列 [READ MORE]

ARRAY フィールドは、同じデータ型の要素を順序付けて格納するフィールドです。

構造体 [READ MORE]

エンティティ内の配列フィールド（または StructArray フィールド）は、順序付けられた構造体要素のセットを格納します。配列内の各構造体は、複数のベクトルとスカラーフィールドで構成される、事前に定義された同一のスキーマを共有します。

ジオメトリ [READ MORE]

地理情報システム（GIS）、マッピングツール、位置情報サービスなどのアプリケーションを構築する際、ジオメトリデータの保存とクエリが必要になることがよくあります。Milvus の `GEOMETRY` データ型は、柔軟なジオメトリデータをネイティブに保存・クエリする方法を提供し、この課題を解決します。

TIMESTAMPTZ [READ MORE]

eコマースシステム、コラボレーションツール、分散ログなど、地域をまたがる時間を追跡するアプリケーションでは、タイムゾーン付きタイムスタンプの正確な処理が必要です。Zilliz Cloud の `TIMESTAMPTZ` データ型は、タイムゾーンと関連付けられたタイムスタンプを保存することで、この機能を提供します。

ダイナミックフィールド [READ MORE]

Zilliz Cloud では、ダイナミックフィールドと呼ばれる特別な機能を通じて、柔軟で進化する構造を持つエンティティを挿入できます。このフィールドは `$meta` という名前の隠し JSON フィールドとして実装されており、コレクションスキーマに明示的に定義されていないデータ内のすべてのフィールドを自動的に保存します。

NULL許容フィールド [READ MORE]

Zilliz Cloud は NULL許容フィールドをサポートしており、フィールド値を欠損させるか、明示的に NULL に設定することができます。NULL許容性はスキーマレベルで定義され、データ取り込み、インデックス作成、検索、およびクエリ操作全体で一貫して適用されます。

デフォルト値 [READ MORE]

Zilliz Cloud では、プライマリフィールドを除くスカラーフィールドにデフォルト値を設定できます。フィールドにデフォルト値が構成されている場合、挿入時にデータが提供されていないと、Zilliz Cloud が自動的にこの値を適用します。

Analyzer [READ MORE]

テキスト処理において、Analyzer は生テキストを検索可能な構造化形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精査することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud での Analyzer の使用方法について詳しく説明します。

フィールドを変更 [READ MORE]

コレクションフィールドのプロパティを変更して、列の制約を変更したり、より厳格なデータ整合性ルールを適用したりできます。

コレクションスキーマの変更 [READ MORE]

コレクションが開発段階から本番環境へ移行するにつれて、各エンティティに関連するフィールドは頻繁に変化します。フィルタリングやアプリケーションロジックのために `source_uri` や `review_status` などのスカラーフィールドを追加したり、アプリケーションが生成した埋め込み用の新しいベクトルフィールドを追加したりできます。コレクションスキーマの変更では、コレクションを作成し直す代わりに、サポートされているフィールド変更をその場で実行できます。

ベストプラクティス [READ MORE]

この章では、データセットに関連するスキーマ設計のベストプラクティスについて説明します。