スキーマとデータフィールド
スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。
概要 [READ MORE]
スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を行う必要があります。このページでは、コレクションのスキーマを理解し、独自のスキーマの設計例を作成するのに役立ちます。
プライマリフィールド [READ MORE]
Zilliz Cloud のすべてのコレクションには、各エンティティを一意に識別するプライマリフィールドが必要です。このフィールドにより、すべてのエンティティを曖昧さなく挿入、更新、クエリ、または削除できます。
密ベクトル [READ MORE]
密ベクトルは、機械学習やデータ分析で広く使用される数値データ表現です。実数からなる配列で、ほとんどまたはすべての要素が非ゼロです。疎ベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値が保持されます。この表現は複雑なパターンや関係性を効果的に捉えることができ、高次元空間でのデータの分析や処理を容易にします。密ベクトルは通常、数十から数百、場合によっては数千の固定された次元数を持ち、特定のアプリケーションや要件によって異なります。
バイナリベクトル [READ MORE]
バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、ストレージと計算コストも削減されながら、セマンティック情報が保持されます。非重要な特徴の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の完全性と有用性を効果的に維持できます。
疎ベクトル [READ MORE]
疎ベクトルは、情報検索や自然言語処理において表層的な用語の一致を捉える重要な手法です。密ベクトルが意味的理解に優れている一方で、疎ベクトルは特別な用語やテキスト識別子を検索する際に、より予測可能な一致結果を提供することが多いです。
文字列 [READ MORE]
Zilliz Cloud クラスタでは、`VARCHAR` は文字列データを格納するために使用されるデータ型です。
ブール値と数値 [READ MORE]
ブール値または数値フィールドは、ブール値または数値を格納するスカラーフィールドです。これらの値は、2つの可能な値のいずれか、または整数(整数)と小数(浮動小数点数)です。これらは通常、数量、測定値、または論理的または数学的に処理する必要があるデータを表すために使用されます。
JSON [READ MORE]
この章では、JSON フィールド型について紹介し、JSON フィールドのインデックス作成方法に関するガイドを提供します。
配列 [READ MORE]
ARRAY フィールドは、同じデータ型の要素の順序付きセットを保存します。
構造体 [READ MORE]
エンティティ内の配列フィールド(または StructArray フィールド)は、順序付けられた構造体要素のセットを格納します。配列内の各構造体は、複数のベクトルとスカラーフィールドで構成される、事前に定義された同一のスキーマを共有します。
ジオメトリ [READ MORE]
地理情報システム(GIS)、マッピングツール、位置情報サービスなどのアプリケーションを構築する際、ジオメトリデータの保存とクエリが必要になることがよくあります。Milvus の `GEOMETRY` データ型は、柔軟なジオメトリデータをネイティブに保存・クエリする方法を提供し、この課題を解決します。
TIMSTAMPTZ [READ MORE]
越境ECシステム、コラボレーションツール、分散ログなど、地域をまたがる時間を追跡するアプリケーションでは、タイムゾーン付きタイムスタンプの正確な処理が必要です。Zilliz Cloud の `TIMESTAMPTZ` データ型は、タイムスタンプとそれに関連付けられたタイムゾーンを一緒に保存することで、この機能を提供します。
ダイナミックフィールド [READ MORE]
Zilliz Cloud では、ダイナミックフィールドと呼ばれる特別な機能を通じて、柔軟で進化し続ける構造を持つエンティティを挿入できます。このフィールドは `$meta` という名前の隠し JSON フィールドとして実装されており、コレクションのスキーマに明示的に定義されていないデータ内のあらゆるフィールドを自動的に保存します。
NULL許容フィールド [READ MORE]
Zilliz Cloud は NULL許容フィールドをサポートしており、フィールド値を欠損させるか、明示的に NULL に設定することができます。Nullability はスキーマレベルで定義され、データの取り込み、インデックス作成、検索、およびクエリ操作全体で一貫して適用されます。
デフォルト値 [READ MORE]
Zilliz Cloud では、スカラーフィールド(プライマリフィールドを除く)にデフォルト値を設定できます。フィールドにデフォルト値が構成されている場合、挿入時にデータが提供されていないと、Zilliz Cloud が自動的にこの値を適用します。
Analyzer [READ MORE]
テキスト処理において、Analyzer は生テキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精査することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud における Analyzer の使用方法について詳しく説明します。
フィールドを変更 [READ MORE]
コレクションフィールドのプロパティを変更して、列の制約を変更したり、より厳格なデータ整合性ルールを適用したりできます。
フィールドを追加 [READ MORE]
Milvus を使用すると、既存のコレクションに新しいフィールドを動的に追加できます。これにより、アプリケーションのニーズの変化に応じてデータスキーマを簡単に進化させることができます。このガイドでは、実用的な例を使用して、さまざまなシナリオでフィールドを追加する方法を説明します。
ベストプラクティス [READ MORE]
この章では、データセットに関連するスキーマ設計のベストプラクティスについて説明します。