スキーマ & データフィールド
スキーマはコレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では主にスキーマと関連概念について説明します。
スキーマの説明 [READ MORE]
スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を練る必要があります。このページでは、コレクションスキーマを理解し、独自の例となるスキーマを設計するのに役立ちます。
プライマリフィールド & AutoID [READ MORE]
Zilliz Cloudのすべてのコレクションには、各エンティティを一意に識別するためのプライマリフィールドが必要です。このフィールドにより、すべてのエンティティが曖昧性なく挿入、更新、クエリ、削除できます。
密ベクトル [READ MORE]
密ベクトルは、機械学習およびデータ分析で広く使用されている数値データ表現です。非ゼロ要素が大部分またはすべて含まれる実数配列で構成されています。スパースベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元が意味のある値を持っているため、複雑なパターンや関係性を効果的に捉えることができます。この表現により、高次元空間でのデータの分析および処理が容易になります。密ベクトルは通常、数十から数百、または数千の固定次元数を持ちます。これは特定のアプリケーションと要件によって異なります。
バイナリベクトル [READ MORE]
バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、セマンティック情報を維持したままストレージと計算コストを削減できます。非クリティカル機能の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の整合性と有用性を効果的に維持できます。
スパースベクトル [READ MORE]
スパースベクトルは、情報検索および自然言語処理における表面レベルの用語一致を捉える重要な方法です。密ベクトルが意味的理解に優れている一方で、スパースベクトルは特殊な用語やテキスト識別子を検索する際により予測可能な一致結果を提供します。
String Field [READ MORE]
Zilliz Cloudクラスターでは、文字列データを格納するためのデータ型として`VARCHAR`が使用されます。
Boolean & Number [READ MORE]
Booleanまたはnumberフィールドは、Boolean値または数値を格納するスカラーフィールドです。これらの値は、2つの可能な値のいずれか、または整数(**integers**)と小数(**floating-point numbers**)のいずれかです。これらは通常、数量、測定値、または論理的または数学的に処理する必要があるデータを表すために使用されます。
JSONフィールド [READ MORE]
この章ではJSONフィールド型を紹介し、JSONフィールドにインデックスを付ける方法についてのガイドを提供します。
配列フィールド [READ MORE]
配列フィールドは、同じデータ型の要素の順序付きセットを保存します。
構造体の配列 [READ MORE]
エンティティ内の構造体の配列(Array of Structs)フィールドは、構造体要素の順序付きセットを格納します。配列内の各構造体は、複数のベクトルとスカラーフィールドを含む同じ事前定義されたスキーマを共有します。
ジオメトリーフィールド [READ MORE]
地理情報システム(GIS)、マッピングツール、位置ベースのサービスなどのアプリケーションを構築する際、ジオメトリーデータを保存およびクエリする必要がよくあります。Milvusの `GEOMETRY` データ型は、柔軟なジオメトリーデータを保存およびクエリするためのネイティブな方法を提供することでこの課題を解決します。
Dynamic Field [READ MORE]
Zilliz Cloudは、動的フィールドと呼ばれる特別な機能を通じて、柔軟で進化する構造を持つエンティティを挿入できます。このフィールドは`#meta`という名前の非表示のJSONフィールドとして実装され、コレクションスキーマで明示的に定義されていないデータ内のすべてのフィールドを自動的に格納します。
Nullable & Default [READ MORE]
Zilliz Cloudでは、プライマリフィールドを除くスカラーフィールドに対して`nullable`属性とデフォルト値を設定できます。`nullable=True`とマークされたフィールドの場合、データ挿入時にフィールドをスキップするか、直接null値に設定でき、システムはエラーを発生させずにnullとして扱います。フィールドにデフォルト値がある場合、挿入時にフィールドのデータが指定されていないとシステムは自動的にこの値を適用します。
Analyzer [READ MORE]
テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、2つのコア要素(トークナイザーとフィルター)で構成されています。これらは一緒に動作して入力テキストをトークンに変換し、これらのトークンを洗練させ、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloudでアナライザーを使用する際の詳細情報を提供します。
Alter Collection Field [READ MORE]
カラム制約を変更したり、より厳格なデータ整合性ルールを適用するために、コレクションフィールドのプロパティを変更できます。
既存コレクションへのフィールド追加 [READ MORE]
Milvusでは、既存のコレクションに新しいフィールドを動的に追加でき、アプリケーションのニーズに応じてデータスキーマを容易に変更できます。このガイドでは、実際の例を使用してさまざまなシナリオでフィールドを追加する方法を示します。
ベストプラクティス [READ MORE]
この章では、データセットに関連するスキーマ設計のベストプラクティスについて説明します。