スキーマとデータフィールド
スキーマはコレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では主にスキーマと関連概念について説明します。
スキーマの説明 [READ MORE]
スキーマはコレクションのデータ構造を定義します。コレクションを作成する前に、そのスキーマの設計を練る必要があります。このページでは、コレクションスキーマを理解し、独自の例となるスキーマを設計する方法を説明します。
主フィールドとAutoID [READ MORE]
Zilliz Cloudのすべてのコレクションには、各エンティティを一意に識別するための主フィールドが必要です。このフィールドにより、すべてのエンティティを明確に挿入、更新、クエリ、削除できます。
デンスベクトル [READ MORE]
デンスベクトルは、機械学習およびデータ分析で広く使用される数値データ表現です。ゼロでない要素が大部分またはすべて含まれる実数の配列で構成されています。スパースベクトルと比較して、デンスベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値が保持されています。この表現により、複雑なパターンや関係性を効果的に捉えることができ、高次元空間でのデータの分析と処理が容易になります。デンスベクトルは通常固定された次元数を持ち、数十から数百、数千に及ぶまで、特定のアプリケーションと要件に応じて異なります。
バイナリベクトル [READ MORE]
バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換はベクトルのサイズを圧縮するだけでなく、セマンティック情報を保持しながらストレージと計算コストを削減します。非重要機能の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の完全性と有用性を効果的に維持できます。
スパースベクトル [READ MORE]
スパースベクトルは、情報検索および自然言語処理における表面レベルの用語一致を捉える上で重要な方法です。デンスベクトルがセマンティック理解に優れている一方で、スパースベクトルは特に特殊な用語やテキスト識別子を検索する場合に、より予測可能な一致結果を提供します。
文字列フィールド [READ MORE]
Zilliz Cloudクラスターでは、文字列データを保存するために`VARCHAR`がデータ型として使用されます。
数字フィールド [READ MORE]
数値フィールドは、数値を格納するスカラーフィールドです。これらの値は、整数(整数)または10進数(浮動小数点数)である場合があります。通常、量、測定値、または数学的に処理する必要があるデータを表すために使用されます。
JSON Field [READ MORE]
This chapter introduces the JSON field type, and provides guides on how to index a JSON field.
配列フィールド [READ MORE]
ARRAYフィールドは、同じデータ型の要素の順序付きセットを格納します。以下は、ARRAYフィールドがデータを格納する方法の例です。
ダイナミックフィールド [READ MORE]
コレクションのスキーマで定義されたすべてのフィールドは、挿入するエンティティに含める必要があります。一部のフィールドをオプションにしたい場合は、動的フィールドを有効にすることを検討してください。このトピックでは、動的フィールドを有効にして使用する方法について説明します。
Array of Structs [READ MORE]
An Array of Structs field in an entity stores an ordered set of Struct elements. Each Struct in the Array shares the same pre-defined schema, comprising multiple vectors and scalar fields.
Nullableデフォルト [READ MORE]
Zilliz Cloudを使用すると、プライマリフィールドを除くスカラーフィールドの`nullable`属性とデフォルト値を設定できます。`nullable=True`としてマークされたフィールドの場合、データを挿入するときにフィールドをスキップするか、直接null値に設定すると、システムはエラーを引き起こすことなくnullとして扱います。フィールドにデフォルト値がある場合、挿入中にフィールドにデータが指定されていない場合、システムは自動的にこの値を適用します。
Geometry Field [READ MORE]
When building applications like Geographic Information Systems (GIS), mapping tools, or location-based services, you often need to store and query geometric data. The `GEOMETRY` data type in Milvus solves this challenge by providing a native way to store and query flexible geometric data.
アナライザ [READ MORE]
テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーとフィルターの2つのコア要素で構成されています。これらを組み合わせることで、入力テキストをトークンに変換し、これらのトークンを改良し、効率的なインデックス作成と取得のために準備します。この章では、Zilliz Cloudでアナライザーを使用する方法について、詳しく説明します。
コレクションフィールドを変更する [READ MORE]
コレクションフィールドのプロパティを変更して、列の制約を変更したり、より厳格なデータ整合性ルールを適用したりできます。
Add Fields to an Existing Collection [READ MORE]
Milvus allows you to dynamically add new fields to existing collections, making it easy to evolve your data schema as your application needs change. This guide shows you how to add fields in different scenarios using practical examples.
Best Practices [READ MORE]
This chapter covers best practices for schema design related to your dataset.