メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

スキーマ & データフィールド

スキーマはコレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では主にスキーマと関連概念について説明します。

密ベクトル [READ MORE]

密ベクトルは、機械学習およびデータ分析で広く使用されている数値データ表現です。非ゼロ要素が大部分またはすべて含まれる実数配列で構成されています。スパースベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元が意味のある値を持っているため、複雑なパターンや関係性を効果的に捉えることができます。この表現により、高次元空間でのデータの分析および処理が容易になります。密ベクトルは通常、数十から数百、または数千の固定次元数を持ちます。これは特定のアプリケーションと要件によって異なります。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、セマンティック情報を維持したままストレージと計算コストを削減できます。非クリティカル機能の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の整合性と有用性を効果的に維持できます。

Nullable & Default [READ MORE]

Zilliz Cloudでは、プライマリフィールドを除くスカラーフィールドに対して`nullable`属性とデフォルト値を設定できます。`nullable=True`とマークされたフィールドの場合、データ挿入時にフィールドをスキップするか、直接null値に設定でき、システムはエラーを発生させずにnullとして扱います。フィールドにデフォルト値がある場合、挿入時にフィールドのデータが指定されていないとシステムは自動的にこの値を適用します。

Analyzer [READ MORE]

テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、2つのコア要素(トークナイザーとフィルター)で構成されています。これらは一緒に動作して入力テキストをトークンに変換し、これらのトークンを洗練させ、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloudでアナライザーを使用する際の詳細情報を提供します。