スキーマとデータフィールド
スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。
概要 [READ MORE]
スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を行う必要があります。このページでは、コレクションスキーマの理解と、独自にサンプルスキーマを設計する方法について解説します。
主キーフィールド [READ MORE]
Zilliz Cloud のすべてのコレクションには、各エンティティを一意に識別するための主キーフィールドが必要です。このフィールドにより、すべてのエンティティを曖昧さなく挿入、更新、クエリ、または削除できます。
密ベクトル [READ MORE]
密ベクトルは、機械学習やデータ分析で広く利用される数値データ表現です。実数の配列で構成され、ほとんどの要素またはすべての要素が非ゼロとなります。疎ベクトルと比較して、密ベクトルは同じ次元レベルにおいてより多くの情報を含んでおり、各次元が意味のある値を保持しています。この表現により、複雑なパターンや関係性を効果的に捉えることができ、高次元空間におけるデータの分析と処理を容易にします。密ベクトルは通常、特定のアプリケーションや要件に応じて、数十から数百、場合によっては数千に及ぶ固定された次元数を持ちます。
バイナリベクトル [READ MORE]
バイナリベクトルは、従来の高次元浮動小数点ベクトルを 0 と 1 のみで構成されるバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮され、ストレージおよび計算コストが削減されると同時に、意味情報が保持されます。重要度の低い特徴に対する精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの完全性と有用性の大部分を効果的に維持できます。
疎ベクトル [READ MORE]
疎ベクトルは、情報検索や自然言語処理において表面的な用語の一致を捉えるための重要な手法です。密ベクトルが意味理解に優れている一方、疎ベクトルは特に特殊な用語やテキスト識別子を検索する際に、より予測可能な一致結果を提供します。
文字列 [READ MORE]
Zilliz Cloud クラスターでは、文字列データを格納するために `VARCHAR` データ型が使用されます。
Boolean & Number [READ MORE]
Boolean フィールドまたは数値フィールドは、ブール値または数値を格納するスカラーフィールドです。これらの値は、2 つの可能な値のいずれか、整数、または浮動小数点数です。これらは通常、数量、測定値、または論理的あるいは数学的に処理が必要なデータを表すために使用されます。
JSON [READ MORE]
この章では、JSON フィールド型について紹介し、JSON フィールドのインデックス作成方法に関するガイドを提供します。
配列 [READ MORE]
ARRAY フィールドは、同じデータ型の要素からなる順序付きのセットを格納します。
構造体 [READ MORE]
エンティティ内の構造体の配列フィールドは、順序付けられた構造体要素のセットを格納します。配列内の各構造体は、複数のベクトルとスカラーフィールドで構成される、事前に定義された同一のスキーマを共有します。
ジオメトリ [READ MORE]
地理情報システム(GIS)、マッピングツール、位置情報サービスなどのアプリケーションを構築する際、幾何データの保存とクエリが必要になることがよくあります。Milvus の `GEOMETRY` データ型は、柔軟な幾何データをネイティブに保存およびクエリするための手段を提供することで、この課題を解決します。
TIMSTAMPTZ [READ MORE]
E コマースシステム、コラボレーションツール、分散型ログ記録など、地域間で時間を追跡するアプリケーションでは、タイムゾーン付きのタイムスタンプを正確に処理する必要があります。Zilliz Cloud の `TIMESTAMPTZ` データ型は、関連するタイムゾーンとともにタイムスタンプを保存することで、この機能を提供します。
動的フィールド [READ MORE]
Zilliz Cloud では、動的フィールドと呼ばれる特別な機能を使用して、柔軟で進化する構造を持つエンティティを挿入できます。このフィールドは `$meta` という名前の非表示 JSON フィールドとして実装されており、コレクションスキーマで明示的に定義されていないデータ内のすべてのフィールドを自動的に保存します。
NULL 許容フィールド [READ MORE]
Milvus は NULL 許容フィールドをサポートしており、フィールド値を欠落させるか、明示的に NULL に設定することができます。NULL 許容性はスキーマレベルで定義され、データ取り込み、インデックス作成、検索、およびクエリ操作全体で一貫して適用されます。
デフォルト値 [READ MORE]
Milvus では、スカラーフィールド(プライマリフィールドを除く)にデフォルト値を設定できます。フィールドにデフォルト値が構成されている場合、挿入時にデータが提供されていないと、Milvus が自動的にこの値を適用します。
Analyzer [READ MORE]
テキスト処理において、Analyzer は生テキストを検索可能な構造化形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精製することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud における Analyzer の使用方法について詳しく説明します。
フィールドの変更 [READ MORE]
コレクションフィールドのプロパティを変更して、列の制約を変更したり、より厳格なデータ整合性ルールを適用したりできます。
フィールドの追加 [READ MORE]
Milvus を使用すると、既存のコレクションに動的に新しいフィールドを追加できるため、アプリケーションの要件の変化に合わせてデータスキーマを簡単に進化させることができます。このガイドでは、実用的な例を用いて、さまざまなシナリオでフィールドを追加する方法を示します。
ベストプラクティス [READ MORE]
この章では、データセットに関連するスキーマ設計のベストプラクティスについて説明します。