メインコンテンツまでスキップ
バージョン: User Guides (Cloud)

アナライザー

テキスト処理において、アナライザーは、生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーフィルターという2つのコア要素で構成されています。これらが連携して、入力テキストをトークンに変換し、これらのトークンを洗練し、効率的なインデックス作成と検索のために準備します。この章では、Zilliz Cloudでアナライザーを使用するための詳細な情報を提供します。

概要 [READ MORE]

テキスト処理において、アナライザーは生テキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーとフィルターという 2 つのコア要素で構成されています。これらが連携して入力テキストをトークンに変換し、これらのトークンを精査することで、効率的なインデックス作成と検索の準備を行います。

多言語アナライザー [READ MORE]

Zilliz Cloud がテキスト分析を実行する場合、通常、コレクション内のテキストフィールド全体に単一のアナライザーを適用します。そのアナライザーが英語用に最適化されている場合、中国語、スペイン語、フランス語などの他の言語で必要とされる非常に異なるトークン化およびステミングルールに対応できず、リコール率が低下します。たとえば、スペイン語の単語「teléfono」(「電話」を意味する)を検索すると、英語に特化したアナライザーではアクセントが削除され、スペイン語固有のステミングが適用されないため、関連する結果が見落とされる可能性があります。