メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

スキーマとデータフィールド

スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。

密ベクトル [READ MORE]

密ベクトルは、機械学習やデータ分析で広く使用される数値データ表現です。実数からなる配列で、ほとんどまたはすべての要素が非ゼロです。疎ベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値が保持されます。この表現は複雑なパターンや関係性を効果的に捉えることができ、高次元空間でのデータの分析や処理を容易にします。密ベクトルは通常、数十から数百、場合によっては数千の固定された次元数を持ち、特定のアプリケーションや要件によって異なります。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、ストレージと計算コストも削減されながら、セマンティック情報が保持されます。非重要な特徴の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の完全性と有用性を効果的に維持できます。

Analyzer [READ MORE]

テキスト処理において、Analyzer は生テキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精査することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud における Analyzer の使用方法について詳しく説明します。