メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

線形減衰

線形減衰は、検索結果において絶対的なゼロ地点で終了する直線的な減少を作成します。イベントのカウントダウンのように、イベントが過ぎると関連性が徐々に薄れていくように、線形減衰は、アイテムが理想的な地点から離れるにつれて、完全に消滅するまで、予測可能で安定した関連性の低下を適用します。このアプローチは、明確なカットオフを伴う一貫した減衰率が必要な場合に理想的であり、特定の境界を超えるアイテムが結果から完全に除外されることを保証します。

他の減衰関数とは異なり、

  • ガウス減衰は、徐々にゼロに近づくが、決してゼロに到達しないベルカーブに従います。

  • 指数減衰は、無限に続く最小限の関連性の長いテールを維持します。

線形減衰は、明確な終点を作成するという点で独特であり、自然な境界や期限を持つアプリケーションに特に効果的です。

線形減衰を使用するタイミング

線形減衰は、特に以下の用途に効果的です。

ユースケース

線形がうまく機能する理由

イベントリスト

コンサートチケットプラットフォーム

遠すぎるイベントに対して明確なカットオフを作成します

期間限定オファー

フラッシュセール、プロモーション

期限切れまたは間もなく期限切れになるオファーが表示されないようにします

配送半径

フードデリバリー、宅配サービス

厳密な地理的境界を強制します

年齢制限コンテンツ

出会い系プラットフォーム、メディアサービス

厳密な年齢しきい値を設定します

線形減衰を選択するのは、次のような場合です。

  • アプリケーションに自然な境界、期限、またはしきい値がある場合

  • 特定のポイントを超えるアイテムは結果から完全に除外されるべきである場合

  • 関連性の低下率が予測可能で一貫している必要がある場合

  • ユーザーが関連性の高いアイテムと関連性の低いアイテムの明確な区別を見る必要がある場合

安定した減少の原則

線形減衰は、正確にゼロに達するまで一定の割合で減少する直線的なドロップを作成します。このパターンは、カウントダウンタイマー、在庫の枯渇、関連性に明確な有効期限がある期限の接近など、多くの日常的なシナリオで現れます。

📘Notes

すべての時間パラメータ(originoffsetscale)は、コレクションデータと同じ単位を使用する必要があります。コレクションがタイムスタンプを異なる単位(ミリ秒、マイクロ秒)で保存している場合、すべてのパラメータをそれに応じて調整してください。

LNwQbV5FYo7OYbxaA1VcetPgnUh

上記のグラフは、チケット販売プラットフォームでのイベントリストに線形減衰がどのように影響するかを示しています。

  • origin (現在の日付): 関連性が最大 (1.0) になる現在。

  • offset (1日): 「即時イベントウィンドウ」—次の1日以内に発生するすべてのイベントは、完全な関連性スコア (1.0) を維持し、非常に差し迫ったイベントがわずかな時間差でペナルティを受けないようにします。

  • decay (0.5): スケール距離でのスコア—このパラメータは、関連性の低下率を制御します。

  • scale (10日): 関連性が減衰値に低下する期間—10日先のイベントは、関連性スコアが半分 (0.5) になります。

直線的な曲線からわかるように、約16日以上先のイベントは関連性がゼロになり、検索結果にはまったく表示されません。これにより、ユーザーが定義された時間枠内で関連する今後のイベントのみを表示できるようにする明確な境界が作成されます。

この動作は、イベント計画が通常どのように機能するかを反映しています。差し迫ったイベントが最も関連性が高く、数週間先のイベントは重要性が低下し、遠すぎるイベント(またはすでに過ぎたイベント)はまったく表示されるべきではありません。

線形減衰スコアを計算するための数式は次のとおりです。

S(doc) = \max\left( \frac\{s - \max(0, |fieldvalue_{doc} - origin| - offset)}{s}, 0 \right)

ここで、

s=scale(1.0decay)s = \frac {scale}{(1.0 - decay)}

これを平易な言葉で分解すると、次のようになります。

  1. フィールド値が原点からどれだけ離れているかを計算します: fieldvaluedocorigin|fieldvalue_{doc} - origin|

  2. オフセット(もしあれば)を減算しますが、ゼロを下回らないようにします: max(0,distanceoffset)\max(0, distance - offset)

  3. スケール値と減衰値からパラメータ ss を決定します。

  4. 調整された距離を ss から減算し、ss で割ります。

  5. 結果がゼロを下回らないようにします: max(result,0)\max(result, 0)

ss の計算は、スケールと減衰パラメータをスコアがゼロに達するポイントに変換します。たとえば、decay=0.5 および scale=7 の場合、スコアは距離=14(スケール値の2倍)で正確にゼロに達します。

線形減衰を使用する

線形減衰は、Zilliz Cloud の標準ベクトル検索とハイブリッド検索の両方の操作に適用できます。以下に、この機能を実装するための主要なコードスニペットを示します。

📘Notes

減衰関数を使用する前に、まず、減衰計算に使用される適切な数値フィールド(タイムスタンプ、距離など)を持つコレクションを作成する必要があります。コレクションのセットアップ、スキーマ定義、データ挿入を含む完全な動作例については、減衰ランカーチュートリアルを参照してください。

減衰ランカーを作成する

コレクションが数値フィールド(この例では、event_date が現在からの秒数)で設定されたら、線形減衰ランカーを作成します。

📘Notes

時間単位の一貫性: 時間ベースの減衰を使用する場合、originscale、および offset パラメータがコレクションデータと同じ時間単位を使用していることを確認してください。コレクションがタイムスタンプを秒単位で保存している場合、すべてのパラメータに秒を使用します。ミリ秒を使用している場合、すべてのパラメータにミリ秒を使用します。

from pymilvus import Function, FunctionType
import time

# Calculate current time
current_time = int(time.time())

# Create a linear decay ranker for event listings
# Note: All time parameters must use the same unit as your collection data
rerank = Function(
name="event_relevance", # Function identifier
input_field_names=["event_date"], # Numeric field to use
function_type=FunctionType.RERANK, # Function type. Must be RERANK
params={
"reranker": "decay", # Specify decay reranker
"function": "linear", # Choose linear decay
"origin": current_time, # Current time (seconds, matching collection data)
"offset": 12 * 60 * 60, # 12 hour immediate events window (seconds)
"decay": 0.5, # Half score at scale distance
"scale": 7 * 24 * 60 * 60 # 7 days (in seconds, matching collection data)
}
)

ディケイランカーを定義したら、ranker パラメータに渡すことで、検索操作中に適用できます。

# Apply decay ranker to vector search
result = milvus_client.search(
collection_name,
data=[your_query_vector], # Replace with your query vector
anns_field="dense", # Vector field to search
limit=10, # Number of results
output_fields=["title", "venue", "event_date"], # Fields to return
ranker=rerank, # Apply the decay ranker
consistency_level="Strong"
)