アナライザ
テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーとフィルターの2つのコア要素で構成されています。これらを組み合わせることで、入力テキストをトークンに変換し、これらのトークンを改良し、効率的なインデックス作成と取得のために準備します。この章では、Zilliz Cloudでアナライザーを使用する方法について、詳しく説明します。
アナライザの概要 [READ MORE]
テキスト処理において、アナライザーは生のテキストを構造化された検索可能な形式に変換する重要なコンポーネントです。各アナライザーは通常、トークナイザーとフィルターの2つのコア要素で構成されています。これらを組み合わせることで、入力テキストをトークンに変換し、これらのトークンを改良し、効率的なインデックス作成と検索に備えます。
組み込みアナライザのリファレンス [READ MORE]
このセクションでは、組み込みアナライザに関する詳細情報を提供します。
トークナイザーリファレンス [READ MORE]
このセクションでは、トークナイザーの詳細なリファレンスを提供します。
フィルタリファレンス [READ MORE]
このセクションでは、アナライザのフィルタの詳細なリファレンスを提供します。
Multi-language Analyzers [READ MORE]
When Zilliz Cloud performs text analysis, it typically applies a single analyzer across an entire text field in a collection. If that analyzer is optimized for English, it struggles with the very different tokenization and stemming rules required by other languages, such as Chinese, Spanish, or French, resulting a lower recall rate. For instance, a search for the Spanish word "teléfono" (meaning "phone") would trip up an English‑focused analyzer it may drop the accent and apply no Spanish‑specific stemming, causing relevant results to be overlooked.
Best Practice [READ MORE]
This guide helps you select and configure the most suitable analyzer for your text content in Zilliz Cloud.