メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

スキーマとデータフィールド

スキーマはコレクションのデータ構造を定義し、コレクションのフィールドの名前、順序、データ型、および関連属性を決定します。本章では、主にスキーマと関連する概念について説明します。

密ベクトル [READ MORE]

密ベクトルは、機械学習やデータ分析で広く利用される数値データ表現です。実数の配列で構成され、ほとんどの要素またはすべての要素が非ゼロとなります。疎ベクトルと比較して、密ベクトルは同じ次元レベルにおいてより多くの情報を含んでおり、各次元が意味のある値を保持しています。この表現により、複雑なパターンや関係性を効果的に捉えることができ、高次元空間におけるデータの分析と処理を容易にします。密ベクトルは通常、特定のアプリケーションや要件に応じて、数十から数百、場合によっては数千に及ぶ固定された次元数を持ちます。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを 0 と 1 のみで構成されるバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮され、ストレージおよび計算コストが削減されると同時に、意味情報が保持されます。重要度の低い特徴に対する精度が必須でない場合、バイナリベクトルは元の浮動小数点ベクトルの完全性と有用性の大部分を効果的に維持できます。

Analyzer [READ MORE]

テキスト処理において、Analyzer は生テキストを検索可能な構造化形式に変換する重要なコンポーネントです。各 Analyzer は通常、Tokenizer と Filter という 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、トークンを精製することで、効率的なインデックス作成と検索の準備を行います。この章では、Zilliz Cloud における Analyzer の使用方法について詳しく説明します。