メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

スキーマとデータフィールド

スキーマはコレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では主にスキーマと関連概念について説明します。

密ベクトル [READ MORE]

密ベクトルは機械学習とデータ分析で広く使われる数値データ表現です。実数値で構成される配列からなり、ほとんどの要素が非ゼロです。スパースベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値を保持します。この表現は複雑なパターンと関係を効果的に捉え、データを高次元空間で分析・処理しやすくします。密ベクトルは通常、数十から数百、さらには数千の固定数の次元を持ち、特定のアプリケーションと要件によって異なります。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズを圧縮するだけでなく、セマンティック情報を保持しながらストレージおよび計算コストを削減します。非重要機能の精度が不可欠でない場合、バイナリベクトルは元の浮動小数点ベクトルの完全性と有用性の大部分を効果的に保持できます。

Nullable & Default [READ MORE]

Zilliz Cloudでは、主フィールドを除くスカラーフィールドに対して`nullable`属性とデフォルト値を設定できます。`nullable=True`とマークされたフィールドに対しては、データ挿入時にフィールドをスキップするか、直接null値を設定することができ、システムはそれをエラーなくnullとして扱います。フィールドにデフォルト値がある場合、挿入時にフィールドのデータが指定されていないと、システムは自動的にこの値を適用します。

アナライザー [READ MORE]

テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、2つのコア要素から構成されます:トークナイザーとフィルター。これらは一緒に、入力テキストをトークンに変換し、これらのトークンを洗練させて、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloudでのアナライザーの使用に関する詳細情報を提供します。