メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

スキーマとデータフィールド

スキーマは、コレクションのデータ構造を定義し、コレクションフィールドの名前、順序、データ型、および関連属性を決定します。この章では、主にスキーマと関連する概念について説明します。

密ベクトル [READ MORE]

密ベクトルは、機械学習やデータ分析で広く使用されている数値データ表現です。これらは実数の配列で構成され、ほとんどまたはすべての要素が非ゼロです。疎ベクトルと比較して、密ベクトルは同じ次元レベルでより多くの情報を含んでいます。これは、各次元が意味のある値を保持しているためです。この表現は、複雑なパターンと関係を効果的に捉えることができ、高次元空間でのデータの分析と処理を容易にします。密ベクトルは通常、特定のアプリケーションと要件に応じて、数十から数百、あるいは数千の固定された次元数を持っています。

バイナリベクトル [READ MORE]

バイナリベクトルは、従来の高次元浮動小数点ベクトルを0と1のみを含むバイナリベクトルに変換する特殊なデータ表現形式です。この変換により、ベクトルのサイズが圧縮されるだけでなく、セマンティック情報を保持しながらストレージと計算コストが削減されます。重要でない特徴の精度が不可欠でない場合、バイナリベクトルは元の浮動小数点ベクトルの整合性と有用性のほとんどを効果的に維持できます。

アナライザー [READ MORE]

テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーとフィルターという2つの主要な要素で構成されています。これらが連携して入力テキストをトークンに変換し、これらのトークンを洗練させ、効率的なインデックス作成と検索のために準備します。この章では、Zilliz Cloudでアナライザーを使用するための詳細な情報を提供します。