バージョン: User Guides (Cloud)

[説明] このページは機械翻訳された日本語版です。内容に誤りがございましたら、報告していただけると助かります。

JSONファイルからのインポート

JSON（JavaScriptオブジェクト表記）は、軽量で人間が読めるデータ形式で、機械が容易に解析および生成できます。言語に依存せず、C言語ファミリーのプログラマーに馴染みのある規則に従っているため、理想的なデータ交換形式です。

生データをJSONファイルに準備するには、BulkWriterツールの使用を推奨します。以下の図は、生データがJSONファイルにどのようにマッピングされるかを示しています。

json_data_structure

📘注意

AutoIDを有効にするかどうか

idフィールドはコレクションの主フィールドとして機能します。主フィールドを自動的にインクリメントするには、スキーマでAutoIDを有効にすることができます。この場合、ソースデータの各行からidフィールドを除外する必要があります。

動的フィールドを有効にするかどうか

ターゲットコレクションで動的フィールドが有効になっている場合、事前定義されたスキーマに含まれていないフィールドを格納する必要がある場合は、書き込み操作中に$meta列を指定して対応するキーバリューデータを提供できます。

大文字小文字の区別

辞書のキーとコレクションフィールド名は大文字小文字を区別します。データ内の辞書キーがターゲットコレクションのフィールド名と完全に一致するようにしてください。ターゲットコレクションにidという名前のフィールドがある場合、各エンティティ辞書にはidという名前のキーが必要です。IDやIdを使用するとエラーになります。

ディレクトリ構造

データをJSONファイルに準備する場合は、以下のツリー図に示すように、すべてのJSONファイルを直接ソースデータフォルダに配置してください。

├── json-folder
│       ├── 1.json
│       └── 2.json

データのインポート

データの準備が完了したら、以下のいずれかの方法を使用してZilliz Cloudコレクションにインポートできます。

📘注意

ファイルが比較的小さい場合は、フォルダまたは複数パスの方法を使用して一度にすべてをインポートすることを推奨します。このアプローチにより、インポートプロセス中の内部最適化が可能になり、後のリソース消費を削減するのに役立ちます。

Milvus SDKを使用してZilliz Cloudコンソールでデータをインポートすることもできます。詳細については、データのインポート（コンソール）およびデータのインポート（SDK）を参照してください。

複数パスからのファイルのインポート（推奨）

複数パスからファイルをインポートする場合は、各JSONファイルパスを個別のリストに含め、その後すべてのリストを上位のリストにグループ化します。以下のコード例を参照してください。

curl --request POST \
     --url "https://api.cloud.zilliz.com/v2/vectordb/jobs/import/create" \
     --header "Authorization: Bearer ${TOKEN}" \
     --header "Accept: application/json" \
     --header "Content-Type: application/json" \
     -d '{
        "clusterId": "inxx-xxxxxxxxxxxxxxx",
        "collectionName": "medium_articles",
        "partitionName": "",
        "objectUrls": [
            ["s3://bucket-name/json-folder-1/1.json"],
            ["s3://bucket-name/json-folder-2/1.json"],
            ["s3://bucket-name/json-folder-3/"]
         ],
        "accessKey": "",
        "secretKey": ""
    }'

フォルダからのファイルのインポート

ソースフォルダにインポートするJSONファイルのみが含まれている場合は、リクエストにソースフォルダを以下のように含めることができます。

curl --request POST \
     --url "https://api.cloud.zilliz.com/v2/vectordb/jobs/import/create" \
     --header "Authorization: Bearer ${TOKEN}" \
     --header "Accept: application/json" \
     --header "Content-Type: application/json" \
     -d '{
        "clusterId": "inxx-xxxxxxxxxxxxxxx",
        "collectionName": "medium_articles",
        "partitionName": "",
        "objectUrls": [
            ["s3://bucket-name/json-folder/"]
         ],
        "accessKey": "",
        "secretKey": ""
    }'

単一ファイルのインポート

準備したデータファイルが単一のJSONファイルの場合は、以下のコード例に示すようにインポートします。

curl --request POST \
     --url "https://api.cloud.zilliz.com/v2/vectordb/jobs/import/create" \
     --header "Authorization: Bearer ${TOKEN}" \
     --header "Accept: application/json" \
     --header "Content-Type: application/json" \
     -d '{
        "clusterId": "inxx-xxxxxxxxxxxxxxx",
        "collectionName": "medium_articles",
        "partitionName": "",
        "objectUrls": [
            ["s3://bucket-name/json-folder/1.json"]
         ],
        "accessKey": "",
        "secretKey": ""
    }'

ストレージパス

Zilliz Cloudは、クラウドストレージからのデータインポートをサポートしています。以下の表は、データファイルの可能なストレージパスを一覧表示しています。

クラウド	クイック例
AWS S3	s3://bucket-name/json-folder/ s3://bucket-name/json-folder/data.json
Google Cloud Storage	gs://bucket-name/json-folder/ gs://bucket-name/json-folder/data.json
Azure Blob	https://myaccount.blob.core.windows.net/bucket-name/json-folder/ https://myaccount.blob.core.windows.net/bucket-name/json-folder/data.json

クラウド

クイック例

AWS S3

s3://bucket-name/json-folder/

s3://bucket-name/json-folder/data.json

Google Cloud Storage

gs://bucket-name/json-folder/

gs://bucket-name/json-folder/data.json

Azure Blob

https://myaccount.blob.core.windows.net/bucket-name/json-folder/

https://myaccount.blob.core.windows.net/bucket-name/json-folder/data.json

制限事項

ローカルJSONファイルまたはクラウドストレージからのJSONファイルをインポートする際には、いくつかの制限事項があります。

📘注意

有効なJSONファイルには、rowsという名前のルートキーがあり、その対応する値はターゲットコレクションのスキーマに一致する各エンティティを表す辞書のリストです。

インポート方法	クラスタープラン	1回のインポートあたりの最大ファイル数	最大ファイルサイズ	最大総インポートサイズ
ローカルファイルからのインポート	すべてのプラン	1ファイル	1 GB	1 GB
オブジェクトストレージからのインポート	無料	1,000ファイル	1 GB	1 GB
オブジェクトストレージからのインポート	サーバーレス & 専用	1,000ファイル	10 GB	1 TB

Prepare the data fileを参照して独自にデータを再構築するか、BulkWriterツールを使用してソースデータファイルを生成できます。上記の図のスキーマに基づいて準備されたサンプルデータをダウンロードするにはここをクリックしてください。

ディレクトリ構造​

データのインポート​

複数パスからのファイルのインポート（推奨）​

フォルダからのファイルのインポート​

単一ファイルのインポート​

ストレージパス​

制限事項​