メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

ガウス減衰

ガウス減衰(正規減衰とも呼ばれる)は、検索結果に最も自然な調整をもたらします。人間の視覚が距離とともに徐々にぼやけていくように、ガウス減衰は滑らかなベル型の曲線を作り出し、対象が理想点から離れるにつれて関連性を穏やかに低下させます。このアプローチは、希望範囲のすぐ外側にあるアイテムを厳しくペナルティせず、かつ遠く離れたアイテムの関連性を著しく低下させたい場合に理想的です。

他の減衰ランカーとは異なります:

  • 指数減衰は最初に急激に低下し、初期段階で強いペナルティを与えます
  • 線形減衰はゼロに達するまで一定の割合で減少し、明確なカットオフを生み出します

ガウス減衰は、よりバランスが取れ、直感的でユーザーにとって自然に感じられるアプローチを提供します。

ガウス減衰を使用するタイミング

ガウス減衰は、特に以下のケースで効果的です:

ユースケース

ガウス減衰が適している理由

位置情報に基づく検索

レストラン検索、店舗検索

人間の距離に対する自然な知覚を模倣

コンテンツのレコメンデーション

公開日時に基づく記事の提案

コンテンツの古さに応じて関連性が徐々に低下

商品リスト

目標価格に近い商品

価格が目標から逸脱するにつれて滑らかに関連性が低下

専門性のマッチング

関連経験を持つ専門家の検索

経験の関連性をバランスよく評価

アプリケーションで、厳格なペナルティや明確なカットオフなしに、自然な関連性の低下が必要な場合は、ガウス減衰が最適な選択肢となるでしょう。

ベル曲線の原理

ガウス減衰は、滑らかなベル型の曲線を作り出し、理想点からの距離が増すにつれて関連性を徐々に低下させます。数学者カール・フリードリヒ・ガウスにちなんで名付けられたこの分布は、自然界や統計学において頻繁に現れるため、人間の知覚にとって非常に直感的に感じられます。

DP1AbcqZPoyfqhxpJ2icptjQnfc

上記のグラフは、モバイル検索アプリにおけるレストランランキングへのガウス減衰の影響を示しています:

  • origin(0 km):現在地。関連性が最大(1.0)になります。
  • offset(±300 m):「完全スコアゾーン」。300メートル以内のレストランはすべて完全な関連性スコア(1.0)を維持し、ごく近距離の選択肢がわずかな距離差で不必要にペナルティを受けないようになります。
  • scale(±2 km):関連性が減衰値に低下する距離。ちょうど2キロメートル離れたレストランの関連性スコアは半分(0.5)になります。
  • decay(0.5):スケール距離におけるスコア。このパラメータは、距離に応じてスコアがどれだけ速く低下するかを制御します。

この曲線から分かるように、2 kmを超えるレストランの関連性はさらに低下しますが、決してゼロにはなりません。4〜5 km離れたレストランであっても最小限の関連性を保ち、優れた遠方のレストランが結果に表示され続けます(ただし順位は下がります)。

この挙動は、人々が距離の関連性を自然に捉える方法を模倣しています。近くの場所が好まれますが、特別に優れた選択肢であれば、より遠くまで行くことも厭いません。

数式

ガウス減衰スコアを計算するための数式は次のとおりです:

S(doc) = \exp\left( -\frac\{\left( \max\left(0, \left|fieldvalue_{doc} - origin\right| - offset \right) \right)^2}\{2\sigma^2} \right)

ここで:

\sigma^2 = -\frac{scale^2}\{2 \cdot \ln(decay)}

これを平易な言葉で分解すると:

  1. フィールド値が原点からどれだけ離れているかを計算:fieldvaluedocorigin|fieldvalue_{doc} - origin|
  2. オフセット(ある場合)を引きますが、ゼロ未満にはなりません:max(0,distanceoffset)\max(0, distance - offset)
  3. この調整済み距離を二乗:(adjusted_distance)2(adjusted\_distance)^2
  4. これを 2σ22\sigma^2 で割ります(σ2\sigma^2 はスケールと減衰パラメータから計算されます)
  5. 負の指数を取ることで、0〜1の値を得ます:exp(value)\exp(-value)

σ2\sigma^2 の計算により、スケールと減衰パラメータがガウス分布の分散の二乗に変換されます。これにより、関数は特徴的なベル型の形状になります。

ガウス減衰の使用

ガウス減衰は、Zilliz Cloud の標準ベクトル検索およびハイブリッド検索の両方に適用できます。以下に、この機能を実装するための主要なコードスニペットを示します。

📘Notes

減衰関数を使用する前に、まず減衰計算に使用する数値フィールド(タイムスタンプや距離など)を含むコレクションを作成しておく必要があります。コレクションのセットアップ、スキーマ定義、データ挿入を含む完全な動作例については、チュートリアル: Milvus で時間ベースのランキングを実装するを参照してください。

減衰ランカーの作成

数値フィールド(この例ではユーザーからの距離(メートル単位)を表す distance)を含むコレクションをセットアップした後、ガウス減衰ランカーを作成します:

from pymilvus import Function, FunctionType

# Create a Gaussian decay ranker for location-based restaurant search
rerank = Function(
name="restaurant_distance_decay", # Function identifier
input_field_names=["distance"], # Numeric field for distance in meters
function_type=FunctionType.RERANK, # Function type. Must be RERANK
params={
"reranker": "decay", # Specify decay reranker
"function": "gauss", # Choose Gaussian decay
"origin": 0, # Your current location (0 meters)
"offset": 300, # 300m no-decay zone
"decay": 0.5, # Half score at scale distance
"scale": 2000 # 2 km scale (2000 meters)
}
)

減衰ランカーを定義した後、検索操作時に ranker パラメータにそれを渡すことで適用できます:

# Apply decay ranker to restaurant vector search
result = milvus_client.search(
collection_name,
data=[your_query_vector], # Replace with your query vector
anns_field="dense", # Vector field to search
limit=10, # Number of results
output_fields=["name", "cuisine", "distance"], # Fields to return
ranker=rerank, # Apply the decay ranker
consistency_level="Strong"
)