メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

線形減衰

線形減衰は、検索結果で絶対ゼロ点で終了する直線的な減少を作成します。今後のイベントのカウントダウンのように関連性がイベントの通過まで徐々に薄れていくように、線形減衰はアイテムが理想的なポイントから離れるにつれて予測可能で一定の減少を適用し、最終的には完全に消滅します。このアプローチは、明確なカットオフを持つ一貫した減衰率が必要な場合に理想的です。これにより、ある境界を超えるアイテムが結果から完全に除外されます。

他の減衰関数とは異なり:

  • ガウス減衰はゼロに漸近するが決してゼロにならないベル曲線に従います

  • 指数減衰は無期限に延長される最小限の関連性の長い尾を維持します

線形減衰は明確な終点を作成し、自然な境界や期限を持つアプリケーションに特に効果的です。

線形減衰を使用する場合

線形減衰は特に以下の場合に効果的です:

ユースケース

線形減衰が適している理由

イベント一覧

コンサートチケットプラットフォーム

未来に遠すぎるイベントの明確なカットオフを作成

期間限定オファー

フラッシュセール、プロモーション

期限切れまたはまもなく期限切れになるオファーが表示されないように保証

配達範囲

フードデリバリー、宅配便サービス

地理的境界を強制的に適用

年齢制限コンテンツ

マッチングプラットフォーム、メディアサービス

明確な年齢しきい値を確立

線形減衰を選択してください:

  • あなたのアプリケーションが自然な境界、期限、またはしきい値を持っている場合

  • あるポイントを超えるアイテムが結果から完全に除外されるべき場合

  • 関連性の低下率が予測可能で一定である必要がある場合

  • ユーザーが関連および関連でないアイテムの明確な区別を見られるべき場合

定常的減少の原則

線形減衰は、一定のレートで減少し、正確にゼロで終了する直線的なドロップを作成します。このパターンは、カウントダウンタイマー、在庫の減少、期限の迫った状況など、関連性が明確な有効期限を持つ多くの日常的なシナリオで見られます。

📘注釈

すべての時間パラメータ(originoffsetscale)は、コレクションデータと同じ単位を使用する必要があります。コレクションがタイムスタンプを異なる単位(ミリ秒、マイクロ秒)で保存している場合は、すべてのパラメータをそれに応じて調整してください。

LNwQbV5FYo7OYbxaA1VcetPgnUh

上記のグラフは、線形減衰がチケットプラットフォームでのイベント一覧にどのように影響するかを示しています:

  • origin(現在日):関連性が最大(1.0)である現在時刻。

  • offset(1日):「即時イベントウィンドウ」—翌日に発生するすべてのイベントは完全な関連性スコア(1.0)を維持し、非常にすぐ迫っているイベントがわずかな時間差でペナルティを受けないようにします。

  • decay(0.5):スケール距離でのスコア—このパラメータは関連性の減少率を制御します。

  • scale(10日):関連性が減衰値まで低下する期間—10日先のイベントは関連性スコアが半分(0.5)になります。

この直線的な曲線からわかるように、約16日以上先のイベントは完全にゼロの関連性を持ち、検索結果にまったく表示されません。これにより、ユーザーが定義された時間枠内で関連のある今後のイベントのみを確認できるようにする明確な境界線が作成されます。

この動作はイベント企画が通常どのように機能するかを反映しています—直近のイベントが最も関連性が高く、今後の週のイベントが重要性を下げていき、あまりにも未来(またはすでに過去)のイベントはまったく表示されるべきではありません。

線形減衰スコアを計算するための数学的式は以下の通りです:

S(doc) = \max\left( \frac\{s - \max(0, |fieldvalue_{doc} - origin| - offset)}{s}, 0 \right)

ただし:

s=scale(1.0decay)s = \frac {scale}{(1.0 - decay)}

これを平易な言葉に分解すると:

  1. フィールド値が原点からどれだけ離れているかを計算: fieldvaluedocorigin|fieldvalue_{doc} - origin|

  2. オフセット(ある場合)を減算しますが、ゼロを下回らないように: max(0,distanceoffset)\max(0, distance - offset)

  3. 減衰値とスケール値からパラメータssを決定します。

  4. 修正された距離をssから減算し、ssで割ります。

  5. 結果がゼロを下回らないようにします: max(result,0)\max(result, 0)

ss計算は、スケールと減衰パラメータをスコアがゼロに達する地点に変換します。たとえば、decay=0.5およびscale=7の場合、スコアは距離=14(スケール値の2倍)で正確にゼロになります。

線形減衰を使用

線形減衰は、Zilliz Cloudの標準ベクトル検索およびハイブリッド検索操作の両方に適用できます。この機能を実装するための主要なコードスニペットは以下の通りです。

📘注釈

減衰関数を使用する前に、まず減衰計算に使用される適切な数値フィールド(タイムスタンプ、距離など)を持つコレクションを最初に作成する必要があります。コレクションのセットアップ、スキーマ定義、およびデータ挿入を含む完全な作業例については、減衰ランカーのチュートリアルを参照してください。

減衰ランカーの作成

数値フィールドを持つコレクションがセットアップされた後(この例では、現在から秒単位のevent_date)、線形減衰ランカーを作成します:

📘注釈

時間単位の整合性:時間ベースの減衰を使用する場合、originscale、およびoffsetパラメータがコレクションデータと同じ時間単位を使用していることを確認してください。コレクションがタイムスタンプを秒単位で保存している場合、すべてのパラメータに秒単位を使用してください。ミリ秒単位で保存している場合は、すべてのパラメータにミリ秒単位を使用してください。

from pymilvus import Function, FunctionType
import time

# 現在時刻を計算
current_time = int(time.time())

# イベント一覧のための線形減衰ランカーを作成
# 注:すべての時間パラメータはコレクションデータと同じ単位を使用する必要があります
ranker = Function(
name="event_relevance", # 関数識別子
input_field_names=["event_date"], # 使用する数値フィールド
function_type=FunctionType.RERANK, # 関数タイプ。RERANKでなければなりません
params={
"reranker": "decay", # 減衰再ランカーを指定
"function": "linear", # 線形減衰を選択
"origin": current_time, # 現在時刻(秒、コレクションデータと一致)
"offset": 12 * 60 * 60, # 12時間の即時イベントウィンドウ(秒)
"decay": 0.5, # スケール距離での半分のスコア
"scale": 7 * 24 * 60 * 60 # 7日(秒単位、コレクションデータと一致)
}
)

減衰ランカーを定義した後、検索操作中にrankerパラメータに渡すことで適用できます:

# 減衰ランカーをベクトル検索に適用
result = milvus_client.search(
collection_name,
data=[your_query_vector], # あなたのクエリベクトルに置き換えてください
anns_field="dense", # 検索するベクトルフィールド
limit=10, # 結果数
output_fields=["title", "venue", "event_date"], # 戻すフィールド
ranker=ranker, # 減衰ランカーを適用
consistency_level="Strong"
)

減衰ランカーは、複数のベクトルフィールドを組み合わせるハイブリッド検索操作にも適用できます:

from pymilvus import AnnSearchRequest

# 密ベクトル検索要求を定義
dense = AnnSearchRequest(
data=[your_query_vector_1], # あなたのクエリベクトルに置き換えてください
anns_field="dense_vector",
param={},
limit=10
)

# スパースベクトル検索要求を定義
sparse = AnnSearchRequest(
data=[your_query_vector_2], # あなたのクエリベクトルに置き換えてください
anns_field="sparse_vector",
param={},
limit=10
)

# 減衰ランカーをハイブリッド検索に適用
hybrid_results = milvus_client.hybrid_search(
collection_name,
[dense, sparse], # 複数の検索要求
ranker=ranker, # 同じ減衰ランカー
limit=10,
output_fields=["title", "venue", "event_date"]
)

ハイブリッド検索操作の詳細については、マルチベクトルハイブリッド検索を参照してください。