PineconeからZilliz Cloudへの移行
Pineconeは類似検索を可能にするベクトルデータベースです。PineconeからZilliz Cloudにデータを移行することで、Zilliz Cloudの高性能な検索と分析を活用しながら、密なベクトルと疎なベクトルの両方を管理する機能を強化することができます。
このガイドでは、Pineconeへの接続、データマッピングの設定、潜在的な問題のトラブルシューティングなど、PineconeからZilliz Cloudへのデータ移行の過程を説明します。
考慮事項
-
PineconeからZilliz Cloudにデータを移行すると、ベクトルフィールドが直接転送され、PineconeのメタデータフィールドはZilliz Cloud上の動的フィールドにJSON形式で保存されます。動的フィールド機能の詳細については、「ダイナミックフィールド」を参照してください。
-
互換性を確保するため、Auto IDは無効になり、Zilliz Cloud上の各ターゲットコレクションに対して変更することはできません。
-
この移行はPineconeサーバーレスインデックスのみをサポートします。
-
各移行タスクは単一のソースPineconeインデックスに制限されます。複数のソースインデックスにデータがある場合は、それぞれに別々の移行ジョブを設定できます。
始める前に
-
ソースのPineconeインデックスは一般のインターネットからアクセスできます。
-
ネットワーク環境で許可リストが設定されている場合は、Zilliz CloudのIPアドレスが追加されていることを確認してください。詳細については、「Zilliz CloudのIPアドレス」を参照してください。
-
ターゲットPineconeプロジェクトにアクセスするためのAPIキーを取得しました。
-
Zilliz Cloudでは、組織オーナーまたはプロジェクト管理者の役割が付与されています。必要な権限がない場合は、Zilliz Cloudの管理者にお問い合わせください。
PineconeからZilliz Cloudへの移行
ソースデータを任意のプランレベルのZilliz Cloudクラスタに移行できます(CU体格がソースデータに対応している場合)。
-
Zilliz Cloud コンソールにログインします。
-
ターゲットプロジェクトページに移動し、移行>松ぼっくりを選択してください。
-
「データソースに接続」ステップで、ターゲットのPineconeプロジェクトにアクセスするために使用できるAPIキーを入力します。次に、「次へ」をクリックします。
📘ノート認証により、必要な接続情報を取得することができます。
-
「ソースとターゲットを選択」ステップで、ソースのPineconeインデックスとターゲットのZilliz Cloudクラスタの設定を行います。次に、「次へ」をクリックしてください。
📘ノートPineconeから移行する各ソースインデックスには、ベクトルフィールドが含まれている必要があります。
-
「スキーマ構成」ステップでは、
-
[スキーマプレビュー]で、Pineconeインデックスと対応するZilliz Cloudコレクションのフィールドマッピングを確認します。
📘ノートAuto IDは解除され、変更できません。
PineconeのレコードIDは、Zilliz Cloud上の
VARCHAR
フィールドにプライマリフィールドとしてマップされ、max_length
の範囲は1〜65,535バイトです。エンティティを挿入または挿入する場合は、VARCHAR
フィールドの値がこの制限内に収まるようにしてください。フィールドの名前を変更することはできますが、データ型は固定されており、変更できません。
-
「詳細設定」で、ダイナミックフィールドとパーティションキーの設定を確認してください。
-
ダイナミックフィールド:デフォルトで有効になっており、変更できません。ソースインデックスからメタデータを保存し、一貫性を確保し、柔軟性を維持します。
-
パーティションキー:デフォルトで有効になっています。有効にすると、Zilliz CloudはPinecone名前空間をパーティションキーにマップします。無効にすると、パーティションにマップされます。この機能を有効にしておくことをお勧めします。この状態では、名前空間はVARCHARデータ型を持つターゲットコレクションスキーマのスカラーフィールドとして表示されます。詳細については、「パーティションキーを使う」と「パーティションの管理」を参照してください。
-
-
[ターゲットコレクション名と説明]で、ターゲットコレクション名と説明をカスタマイズします。コレクション名は、各クラスターで一意である必要があります。名前が既存の名前と重複する場合は、コレクション名を変更します。
-
-
[移行]をクリックします。
移行過程を監視する
「移行」をクリックすると、移行ジョブが生成されます。ジョブページで移行の進捗状況を確認できます。ジョブのステータスが「IN PROGRESS」から「SUCCESS FUL」に切り替わると、移行が完了します。
移行後、ターゲットクラスタ内のコレクションとエンティティの数がデータソースと一致していることを確認してください。不一致が見つかった場合は、エンティティが欠落しているコレクションを削除して再移行してください。
移行ジョブをキャンセル
移行過程で問題が発生した場合は、次の手順に従ってトラブルシューティングを行い、移行を再開できます。
-
[ジョブ]ページで、失敗した移行ジョブを特定してキャンセルします。
-
[アクション]列の[詳細を表示]をクリックして、エラーログにアクセスします。