メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

スキーマとデータフィールド

スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。

デンスベクトル [READ MORE]

デンスベクトルは、機械学習やデータ分析で広く使用される数値データ表現です。実数からなる配列で、ほとんどまたはすべての要素が非ゼロです。疎ベクトルと比較して、デンスベクトルは同じ次元レベルでより多くの情報を含み、各次元に意味のある値が保持されています。この表現は複雑なパターンや関係性を効果的に捉えることができ、高次元空間でのデータの分析や処理を容易にします。デンスベクトルの次元数は通常固定されており、具体的なアプリケーションや要件に応じて数十から数百、場合によっては数千の範囲で変化します。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、ストレージと計算コストも削減されながら、セマンティック情報が保持されます。非重要な特徴量の精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの大部分の完全性と有用性を効果的に維持できます。

Analyzer [READ MORE]

テキスト処理において、Analyzer は生テキストを検索可能な構造化形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精査することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud での Analyzer の使用方法について詳しく説明します。