メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

指数減衰

指数減衰は、検索結果において急激な初期の低下とその後の長いテールを生成します。関連性が最初は急速に低下するものの、一部のストーリーは時間の経過とともに重要性を保持する速報ニュースサイクルと同様に、指数減衰は理想的な範囲をわずかに超えるアイテムに厳しいペナルティを適用しつつ、遠く離れたアイテムも発見可能に保ちます。このアプローチは、近接性や最新性を強く優先したいが、より遠いオプションを完全に排除したくない場合に理想的です。

他の減衰関数とは異なり、次の特徴があります。

  • ガウス減衰は、より緩やかなベル型の低下を生成します。

  • 線形減衰は、正確にゼロに達するまで一定の割合で減少します。

指数減衰は、ペナルティを「前倒し」で適用し、関連性の低下の大部分を早期に適用しつつ、最小限ではあるがゼロではない関連性の長いテールを維持するという点で独特です。

指数減衰を使用するタイミング

指数減衰は、特に以下の状況で効果的です。

ユースケース

指数減衰がうまく機能する理由

ニュースフィード

速報ニュースポータル

古いニュースの関連性を迅速に低下させつつ、数日前の重要な記事も表示する

ソーシャルメディアのタイムライン

アクティビティフィード、ステータス更新

新しいコンテンツを強調しつつ、バイラルな古いコンテンツも浮上させる

通知システム

アラートの優先順位付け

最近のアラートに緊急性を持たせつつ、重要なアラートの可視性を維持する

フラッシュセール

期間限定オファー

締め切りが近づくにつれて可視性を急速に低下させる

指数減衰を選択するのは、次のような場合です。

  • ユーザーが非常に最近のアイテムまたは近くのアイテムが結果を強く支配することを期待している場合

  • 古いアイテムまたは遠いアイテムが、非常に適切であればまだ発見可能であるべき場合

  • 関連性の低下が前倒しであるべき場合(最初は急勾配で、その後は緩やかになる)

急激な低下の原則

指数減衰は、最初は急速に低下し、その後徐々に平坦になり、ゼロに近づくが決してゼロにはならない長いテールを形成する曲線を作成します。この数学的パターンは、放射性崩壊、人口減少、時間の経過に伴う情報の関連性など、自然現象で頻繁に現れます。

📘Notes

すべての時間パラメータ(originoffsetscale)は、コレクションデータと同じ単位を使用する必要があります。コレクションがタイムスタンプを異なる単位(ミリ秒、マイクロ秒)で保存している場合、すべてのパラメータをそれに応じて調整してください。

YaRsbolv9oqomcxrFe5cXBa4nNg

上記のグラフは、デジタルニュースプラットフォームにおけるニュース記事のランキングに指数減衰がどのように影響するかを示しています。

  • origin(現在の時間):関連性が最大(1.0)である現在。

  • offset(3時間):「速報ニュースウィンドウ」—過去3時間以内に公開されたすべての記事は、完全な関連性スコア(1.0)を維持し、ごく最近のニュースがわずかな時間差で不必要にペナルティを受けることを防ぎます。

  • decay(0.5):スケール距離でのスコア—このパラメータは、スコアが時間とともにどれだけ劇的に減少するかを制御します。

  • scale(24時間):関連性が減衰値に低下する期間—正確に24時間前のニュース記事は、関連性スコアが半分(0.5)になります。

曲線からわかるように、24時間以上前のニュース記事は関連性が低下し続けますが、ゼロに達することはありません。数日前の記事でさえ、最小限の関連性を保持しているため、重要ではあるが古いニュースがフィードに表示される可能性があります(ただし、ランキングは低くなります)。

この動作は、ニュースの関連性が通常どのように機能するかを模倣しています。ごく最近のストーリーが強く支配しますが、重要な古いストーリーも、ユーザーの興味に非常に適切であれば、まだ浮上することができます。

数式

指数減衰スコアを計算するための数学式は次のとおりです。

S(doc)=exp(λmax(0,fieldvaluedocoriginoffset))S(doc) = \exp\left( \lambda \cdot \max\left(0, \left|fieldvalue_{doc} - origin\right| - offset \right) \right)

ここで、

\lambda = \frac\{\ln(decay)}{scale}

これを平易な言葉で分解すると、次のようになります。

  1. フィールド値が原点からどれだけ離れているかを計算します: fieldvaluedocorigin|fieldvalue_{doc} - origin|

  2. オフセット(もしあれば)を減算しますが、ゼロを下回ることはありません: max(0,distanceoffset)\max(0, distance - offset)

  3. スケールと減衰パラメータから計算された λ\lambda を掛けます。

  4. 指数を取ると、0から1の間の値が得られます: exp(λvalue)\exp(\lambda \cdot value)

λ\lambda の計算は、スケールと減衰パラメータを指数関数のレートパラメータに変換します。より負の λ\lambda は、より急な初期の低下を生成します。

指数減衰を使用する

指数減衰は、Zilliz Cloud の標準ベクトル検索とハイブリッド検索の両方の操作に適用できます。以下に、この機能を実装するための主要なコードスニペットを示します。

📘Notes

減衰関数を使用する前に、まず、減衰計算に使用される適切な数値フィールド(タイムスタンプ、距離など)を持つコレクションを作成する必要があります。コレクションのセットアップ、スキーマ定義、データ挿入を含む完全な動作例については、減衰ランカーチュートリアルを参照してください。

減衰ランカーを作成する

数値フィールド(この例では publish_time)でコレクションが設定されたら、指数減衰ランカーを作成します。

📘Notes

時間単位の一貫性: 時間ベースの減衰を使用する場合、originscale、および offset パラメータがコレクションデータと同じ時間単位を使用していることを確認してください。コレクションがタイムスタンプを秒単位で保存している場合、すべてのパラメータに秒を使用します。ミリ秒を使用している場合、すべてのパラメータにミリ秒を使用します。

from pymilvus import Function, FunctionType
import datetime

# Create an exponential decay ranker for news recency
# Note: All time parameters must use the same unit as your collection data
rerank = Function(
name="news_recency", # Function identifier
input_field_names=["publish_time"], # Numeric field to use
function_type=FunctionType.RERANK, # Function type. Must be RERANK
params={
"reranker": "decay", # Specify decay reranker
"function": "exp", # Choose exponential decay
"origin": int(datetime.datetime.now().timestamp()), # Current time (seconds, matching collection data)
"offset": 3 * 60 * 60, # 3 hour breaking news window (seconds)
"decay": 0.5, # Half score at scale distance
"scale": 24 * 60 * 60 # 24 hours (in seconds, matching collection data)
}
)

ディケイランカーを定義したら、ranker パラメータに渡すことで、検索操作中に適用できます。

# Apply decay ranker to vector search
result = milvus_client.search(
collection_name,
data=[your_query_vector], # Replace with your query vector
anns_field="dense", # Vector field to search
limit=10, # Number of results
output_fields=["title", "publish_time"], # Fields to return
ranker=rerank, # Apply the decay ranker
consistency_level="Strong"
)