スキーマとデータフィールド
スキーマはコレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では主にスキーマと関連概念について説明します。
スキーマの説明 [READ MORE]
スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を行う必要があります。このページでは、コレクションスキーマを理解し、独自の例となるスキーマを設計する方法を説明します。
主フィールドとAutoID [READ MORE]
Zilliz Cloudのすべてのコレクションには、各エンティティを一意に識別するための主フィールドが必要です。このフィールドにより、すべてのエンティティを曖昧さなく挿入、更新、クエリ、削除できます。
密ベクトル [READ MORE]
密ベクトルは機械学習とデータ分析で広く使われる数値データ表現です。実数値で構成される配列からなり、ほとんどの要素が非ゼロです。スパースベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値を保持します。この表現は複雑なパターンと関係を効果的に捉え、データを高次元空間で分析・処理しやすくします。密ベクトルは通常、数十から数百、さらには数千の固定数の次元を持ち、特定のアプリケーションと要件によって異なります。
バイナリベクトル [READ MORE]
バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズを圧縮するだけでなく、セマンティック情報を保持しながらストレージおよび計算コストを削減します。非重要機能の精度が不可欠でない場合、バイナリベクトルは元の浮動小数点ベクトルの完全性と有用性の大部分を効果的に保持できます。
スパースベクトル [READ MORE]
スパースベクトルは、情報検索および自然言語処理における表面レベルの用語一致を捉える上で重要な方法です。デンスベクトルがセマンティック理解に優れている一方で、スパースベクトルは特に特殊な用語やテキスト識別子を検索する場合に、より予測可能な一致結果を提供します。
文字列フィールド [READ MORE]
Zilliz Cloudクラスターでは、文字列データを保存するために`VARCHAR`がデータ型として使用されます。
Boolean & Number [READ MORE]
ブール値または数値フィールドは、ブール値または数値を格納するスカラーフィールドです。これらの値は2つの可能な値のいずれか、または整数と10進数(浮動小数点数)です。通常、数量、測定値、または論理的または数学的に処理する必要のあるデータを表現するために使用されます。
JSONフィールド [READ MORE]
この章ではJSONフィールドの種類を紹介し、JSONフィールドにインデックスを設定する方法を説明します。
配列フィールド [READ MORE]
ARRAYフィールドは、同じデータ型の要素の順序付きセットを保存します。
構造体の配列 [READ MORE]
エンティティ内の構造体の配列フィールドは、構造体要素の順序付きセットを格納します。配列内の各構造体は、複数のベクトルおよびスカラーフィールドで構成される同じ事前定義されたスキーマを共有します。
Geometry Field [READ MORE]
When building applications like Geographic Information Systems (GIS), mapping tools, or location-based services, you often need to store and query geometric data. The `GEOMETRY` data type in Milvus solves this challenge by providing a native way to store and query flexible geometric data.
動的フィールド [READ MORE]
Zilliz Cloudでは、動的フィールドと呼ばれる特別な機能を通じて、柔軟で進化する構造を持つエンティティを挿入できます。このフィールドは`#meta`という名前の非表示のJSONフィールドとして実装され、コレクションスキーマで明示的に定義されていないデータ内のすべてのフィールドを自動的に格納します。
Nullable & Default [READ MORE]
Zilliz Cloudでは、主フィールドを除くスカラーフィールドに対して`nullable`属性とデフォルト値を設定できます。`nullable=True`とマークされたフィールドに対しては、データ挿入時にフィールドをスキップするか、直接null値を設定することができ、システムはそれをエラーなくnullとして扱います。フィールドにデフォルト値がある場合、挿入時にフィールドのデータが指定されていないと、システムは自動的にこの値を適用します。
アナライザー [READ MORE]
テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、2つのコア要素から構成されます:トークナイザーとフィルター。これらは一緒に、入力テキストをトークンに変換し、これらのトークンを洗練させて、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloudでのアナライザーの使用に関する詳細情報を提供します。
コレクションフィールドの変更 [READ MORE]
コレクションフィールドのプロパティを変更して、列制約を変更したり、データ整合性ルールをより厳格に適用できます。
既存のコレクションにフィールドを追加 [READ MORE]
Milvusでは、既存のコレクションに新しいフィールドを動的に追加することができ、アプリケーションのニーズに応じてデータスキーマを容易に変更できます。このガイドでは、実際の例を使用してさまざまなシナリオでフィールドを追加する方法を説明します。
ベストプラクティス [READ MORE]
この章では、データセットに関連するスキーマ設計のベストプラクティスについて説明します。