メインコンテンツまでスキップ
バージョン: User Guides (BYOC)

Analyzer

テキスト処理において、analyzer(アナライザー)は、生のテキストを構造化された検索可能な形式に変換するための重要なコンポーネントです。各アナライザーは通常、tokenizer(トークナイザー)とfilter(フィルター)という2つのコア要素で構成されています。これらは共同で入力テキストをトークンに変換し、それらのトークンを洗練させて、効率的なインデックス作成および検索の準備を行います。本章では、Zilliz Cloud におけるアナライザーの使用方法について詳しく説明します。

多言語アナライザー [READ MORE]

Zilliz Cloud でテキスト分析を実行する場合、通常はコレクション内のテキストフィールド全体に単一のアナライザーを適用します。そのアナライザーが英語向けに最適化されている場合、中国語、スペイン語、フランス語など他の言語に必要な全く異なるトークン化やステミングの規則に対応できず、再現率(リコール)が低下する可能性があります。例えば、スペイン語の単語「teléfono」(電話の意味)を検索しても、英語中心のアナライザーではアクセント記号が削除され、スペイン語固有のステミングが適用されないため、関連する結果が見逃されてしまうことがあります。