メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

ガウス減衰

ガウス減衰は、正規減衰としても知られていますが、検索結果に対して最も自然に感じられる調整を生成します。距離とともに徐々にぼやけていく人間の視力のように、ガウス減衰は滑らかなベル曲線を作成し、項目が理想的なポイントから離れるにつれて関連性を穏やかに低下させます。このアプローチは、好ましい範囲のわずかに外側にある項目に厳しくペナルティを与えることなくバランスの取れた減衰が必要で、それでも遠く離れた項目の関連性を大幅に削減したい場合に理想的です。

他の減衰ランカーとは異なり:

  • 指数減衰は最初に急激に低下し、初期ペナルティを強化

  • 線形減衰はゼロになるまで一定の速度で低下し、明確なカットオフを作成

ガウス減衰は、ユーザにとって自然に感じられるよりバランスの取れた、直感的なアプローチを提供します。

ガウス減衰を使用する場合

ガウス減衰は特に次のような場合に効果的です:

ユースケース

ガウス減衰が適している理由

位置情報ベースの検索

レストランファインダー、店舗ロケーター

距離関連性の自然な人間の知覚を模倣

コンテンツのレコメンデーション

公開日付に基づく記事の提案

コンテンツが古くなるにつれて関連性が徐々に低下

商品リスト

ターゲット価格に近い商品

価格がターゲットから逸れるにつれて関連性が滑らかに低下

専門知識マッチング

関連経験を持つ専門家を探す

経験の関連性に関するバランスの取れた評価

アプリケーションで厳しいペナルティや厳格なカットオフなしに自然な関連性低下を感じさせたい場合は、ガウス減衰が最良の選択です。

ベル曲線の原則

ガウス減衰は、理想的なポイントから距離が離れるにつれて関連性を徐々に減少させる滑らかなベル曲線を作成します。数学者カール・フリードリヒ・ガウスにちなんで名付けられたこの分布は、自然界や統計学で頻繁に出現するため、人間の知覚には非常に直感的に感じられます。

DP1AbcqZPoyfqhxpJ2icptjQnfc

上記のグラフは、ガウス減衰が携帯検索アプリでのレストランランキングにどのように影響するかを示しています:

  • origin (0 km):現在地で、関連性が最大(1.0)です。

  • offset (±300 m):あなたを中心とした「完全スコアゾーン」—300メートル以内のすべてのレストランは完全な関連性スコア(1.0)を維持し、非常に近いオプションがわずかな距離の違いで不必要にペナルティを受けないようにします。

  • scale (±2 km):関連性が減衰値にまで低下する距離—正確に2キロメートル離れたレストランの関連性スコアは半分(0.5)になります。

  • decay (0.5):スケール距離でのスコア—このパラメータは基本的に距離によるスコアの減少速度を制御します。

この曲線からわかるように、2 kmを超えるレストランは関連性が低下し続けますが、ゼロにはなりません。4〜5 km離れたレストランでも最小限の関連性を保持し、優れたが遠く離れたレストランが結果に表示される可能性を残します(たとえランクが低いとしても)。

この挙動は、人々が距離関連性を自然に考える方法を模倣しています—近隣の場所が好まれますが、例外的なオプションのためにさらに遠くへ行く意思もあります。

ガウス減衰スコアを計算するための数学的式は以下のとおりです:

S(doc) = \exp\left( -\frac\{\left( \max\left(0, \left|fieldvalue_{doc} - origin\right| - offset \right) \right)^2}\{2\sigma^2} \right)

ただし:

\sigma^2 = -\frac{scale^2}\{2 \cdot \ln(decay)}

これを平易な言葉に分解すると:

  1. フィールド値が原点からどれだけ離れているかを計算: fieldvaluedocorigin|fieldvalue_{doc} - origin|

  2. オフセット(ある場合)を減算するが、ゼロを下回らないように: max(0,distanceoffset)\max(0, distance - offset)

  3. この調整された距離を平方: (adjusted_distance)2(adjusted\_distance)^2

  4. 2σ22\sigma^2で割る(これはスケールと減衰パラメータから計算される)

  5. 負の指数を取る(これは0と1の間の値を与える): exp(value)\exp(-value)

σ2\sigma^2の計算は、スケールと減衰パラメータをガウス分布の標準偏差の二乗に変換します。これにより関数に特徴的なベル曲線が与えられます。

ガウス減衰の使用

ガウス減衰は、Zilliz Cloudの標準的なベクトル検索およびハイブリッド検索の両方の操作に適用できます。以下は、この機能を実装するための主要なコードスニペットです。

📘注釈

減衰関数を使用する前に、減衰計算に使用される適切な数値フィールド(タイムスタンプ、距離など)を持つコレクションを最初に作成する必要があります。コレクションのセットアップ、スキーマ定義、およびデータの挿入を含む完全な作業例については、チュートリアル:Milvusで時間ベースのランキングを実装するを参照してください。

減衰ランカーの作成

数値フィールド(この例ではユーザーからのメートル単位のdistance)を持つコレクションがセットアップされた後、ガウス減衰ランカーを作成します:

from pymilvus import Function, FunctionType

# 位置ベースのレストラン検索のためのガウス減衰ランカーを作成
ranker = Function(
name="restaurant_distance_decay", # 関数識別子
input_field_names=["distance"], # 距離を示す数値フィールド(メートル単位)
function_type=FunctionType.RERANK, # 関数タイプ。RERANKに設定する必要があります
params={
"reranker": "decay", # 減衰ランカーを指定
"function": "gauss", # ガウス減衰を選択
"origin": 0, # 現在地(0メートル)
"offset": 300, # 300メートルのノーディケイゾーン
"decay": 0.5, # スケール距離での半分のスコア
"scale": 2000 # 2 kmスケール(2000メートル)
}
)

減衰ランカーを定義した後、検索操作中にrankerパラメータに渡すことで適用できます:

# 減衰ランカーをレストランベクトル検索に適用
result = milvus_client.search(
collection_name,
data=[your_query_vector], # あなたのクエリベクトルに置き換えてください
anns_field="dense", # 検索するベクトルフィールド
limit=10, # 結果数
output_fields=["name", "cuisine", "distance"], # 返却するフィールド
ranker=ranker, # 減衰ランカーを適用
consistency_level="Strong"
)

減衰ランカーは、複数のベクトルフィールドを組み合わせるハイブリッド検索操作にも適用できます:

from pymilvus import AnnSearchRequest

# 密ベクトル検索要求を定義
dense = AnnSearchRequest(
data=[your_query_vector_1], # あなたのクエリベクトルに置き換えてください
anns_field="dense",
param={},
limit=10
)

# スパースベクトル検索要求を定義
sparse = AnnSearchRequest(
data=[your_query_vector_2], # あなたのクエリベクトルに置き換えてください
anns_field="sparse_vector",
param={},
limit=10
)

# 減衰ランカーをレストランハイブリッド検索に適用
hybrid_results = milvus_client.hybrid_search(
collection_name,
[dense, sparse], # 複数の検索リクエスト
ranker=ranker, # 同じ減衰ランカー
limit=10,
output_fields=["name", "cuisine", "distance"]
)

ハイブリッド検索に関する詳細情報については、マルチベクトルハイブリッド検索を参照してください。