フォーマットオプション
Zilliz Cloudは、Parquet(推奨)、JSON、NumPyファイルなど、さまざまな形式でのデータインポートをサポートしています。このセクションでは、これらの形式でデータをインポートする手順と、注意すべき点について説明します。
Parquet (推奨) [READ MORE]
Apache Parquetは、効率的なデータストレージと検索のために設計された、オープンソースの列指向データファイル形式です。大量の複雑なデータを管理するための高性能な圧縮およびエンコーディングスキームを提供し、さまざまなプログラミング言語や分析ツールでサポートされています。
JSON/JSON Line [READ MORE]
JSONは、軽量で人間が読みやすいデータ形式であり、機械が簡単に解析および生成できます。言語に依存せず、Cファミリー言語のプログラマーに馴染みのある規約に従っているため、理想的なデータ交換形式です。
NumPy [READ MORE]
.npy形式は、NumPyの標準バイナリ形式で、単一の配列をその形状とdtype情報を含めて保存し、異なるマシンで正しく再構築できるようにします。生データをParquetファイルに準備するには、BulkWriterツールを使用することをお勧めします。次の図は、生データがどのように.npyファイルのセットにマッピングされるかを示しています。