メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

線形減衰

線形減衰(線形 decay)は、検索結果において明確なゼロ地点で終了する直線的な低下を実現します。例えば、今後のイベントのカウントダウンのように、関連性が徐々に薄れていき、イベントが終了すると完全に消えるような挙動です。線形減衰は、理想的なポイントから離れるにつれて予測可能かつ一定の割合で関連性を低下させ、ある境界を超えたアイテムを完全に結果から除外します。この手法は、一貫した減衰率と明確なカットオフを必要とする場合に最適です。

他の減衰関数とは異なります:

  • ガウス減衰(ガウス decay)はベル曲線に従い、ゼロに近づくものの決してゼロにはなりません。
  • 指数減衰(指数 decay)は、無限に続くわずかな関連性の「長い尾」を維持します。

線形減衰は、明確な終点を作り出すという点で他と一線を画しており、自然な境界や締切のあるアプリケーションに特に効果的です。

線形減衰を使うべきタイミング

線形減衰は、以下のケースに特に有効です:

ユースケース

線形減衰が適している理由

イベント一覧

コンサートチケットプラットフォーム

遠すぎる未来のイベントを明確に除外できる

期間限定オファー

フラッシュセール、プロモーション

期限切れまたは間もなく期限を迎えるオファーを表示しないようにできる

配達範囲

フードデリバリー、宅配サービス

地理的なハードルールを適用できる

年齢制限コンテンツ

マッチングアプリ、メディアサービス

明確な年齢閾値を設定できる

以下のような場合に線形減衰を選択してください:

  • アプリケーションに自然な境界、締切、または閾値がある場合
  • あるポイントを超えたアイテムを結果から完全に除外したい場合
  • 関連性の低下を予測可能かつ一貫したレートで行いたい場合
  • ユーザーに対して関連あり・なしの明確な区切りを見せたい場合

一定低下の原則

線形減衰は、一定の割合で直線的に低下し、正確にゼロに到達します。このパターンは、カウントダウンタイマー、在庫の減少、締切の近づきなど、関連性に明確な「期限」がある日常的なシナリオによく見られます。

📘Notes

すべての時間パラメータ(originoffsetscale)は、コレクションのデータと同じ単位を使用する必要があります。コレクションがミリ秒やマイクロ秒などの異なる単位でタイムスタンプを保存している場合は、すべてのパラメータをそれに合わせて調整してください。

LNwQbV5FYo7OYbxaA1VcetPgnUh

上記のグラフは、チケット販売プラットフォームにおけるイベント一覧への線形減衰の影響を示しています:

  • origin(現在日時):関連性が最大(1.0)となる現在時点。
  • offset(1日):「直近イベントウィンドウ」— 今後1日以内に開催されるイベントは、わずかな時間差によるペナルティを受けず、関連性スコアが1.0のまま維持されます。
  • decay(0.5):スケール距離におけるスコア — このパラメータが関連性の低下速度を制御します。
  • scale(10日):関連性がdecay値まで低下するまでの期間 — 10日先のイベントは、関連性スコアが半分(0.5)になります。

直線的なカーブから分かるように、約16日以上先のイベントは関連性が完全にゼロとなり、検索結果に一切表示されません。これにより明確な境界が設けられ、ユーザーには定義された時間枠内の関連イベントのみが表示されます。

この挙動は、通常のイベント計画の考え方と一致します — 直近のイベントが最も関連性が高く、数週間先のイベントは次第に重要度が下がり、遠すぎる未来(またはすでに過去)のイベントは表示されるべきではありません。

数式

線形減衰スコアを計算するための数式は次のとおりです:

S(doc) = \max\left( \frac\{s - \max(0, |fieldvalue_{doc} - origin| - offset)}{s}, 0 \right)

ここで:

s=scale(1.0decay)s = \frac {scale}{(1.0 - decay)}

これを平易な言葉で分解すると:

  1. フィールド値がoriginからどれだけ離れているかを計算:fieldvaluedocorigin|fieldvalue_{doc} - origin|
  2. offset(ある場合)を引きますが、ゼロ未満にはならないようにする:max(0,distanceoffset)\max(0, distance - offset)
  3. scaleとdecayの値からパラメータ ss を算出。
  4. 調整済みの距離を ss から引き、それを ss で割る。
  5. 結果がゼロ未満にならないようにする:max(result,0)\max(result, 0)

ss の計算により、scaleとdecayパラメータがスコアがゼロになる地点に変換されます。たとえば、decay=0.5、scale=7の場合、スコアは距離=14(scaleの2倍)でちょうどゼロになります。

線形減衰の使用方法

線形減衰は、Zilliz Cloudの標準ベクトル検索およびハイブリッド検索の両方に適用できます。以下に、この機能を実装するための主要なコードスニペットを示します。

📘Notes

減衰関数を使用する前に、まず減衰計算に使用する数値フィールド(タイムスタンプや距離など)を含むコレクションを作成しておく必要があります。コレクションのセットアップ、スキーマ定義、データ挿入を含む完全な動作例については、Decay Ranker Tutorialを参照してください。

減衰ランカーの作成

コレクションに数値フィールド(この例では、現在からの秒数で表される event_date)を設定した後、線形減衰ランカーを作成します:

📘Notes

時間単位の一貫性:時間ベースの減衰を使用する際は、originscaleoffset パラメータがコレクションのデータと同じ時間単位を使用していることを確認してください。コレクションがタイムスタンプを秒単位で保存している場合は、すべてのパラメータを秒単位で指定します。ミリ秒を使用している場合は、すべてミリ秒で指定します。

from pymilvus import Function, FunctionType
import time

# Calculate current time
current_time = int(time.time())

# Create a linear decay ranker for event listings
# Note: All time parameters must use the same unit as your collection data
rerank = Function(
name="event_relevance", # Function identifier
input_field_names=["event_date"], # Numeric field to use
function_type=FunctionType.RERANK, # Function type. Must be RERANK
params={
"reranker": "decay", # Specify decay reranker
"function": "linear", # Choose linear decay
"origin": current_time, # Current time (seconds, matching collection data)
"offset": 12 * 60 * 60, # 12 hour immediate events window (seconds)
"decay": 0.5, # Half score at scale distance
"scale": 7 * 24 * 60 * 60 # 7 days (in seconds, matching collection data)
}
)

減衰ランカーを定義した後、検索操作時に ranker パラメータにそれを渡すことで適用できます:

# Apply decay ranker to vector search
result = milvus_client.search(
collection_name,
data=[your_query_vector], # Replace with your query vector
anns_field="dense", # Vector field to search
limit=10, # Number of results
output_fields=["title", "venue", "event_date"], # Fields to return
ranker=rerank, # Apply the decay ranker
consistency_level="Strong"
)