AWS Athenaで列試行のデータストレージ形式Parquetのデータを扱ってみた
AWS s3上のファイルに対してSQLを発行できるAWSのサービスAthenaを試した。Athenaはスキャン料に応じた従量制の為、列試行のデータストレージParquet形式のファイルとCSVとのRun Time 、スキャン量の比較を行った。列を指定すればParquetのスキャン量が少ないはず
AWS s3上のファイルに対してSQLを発行できるAWSのサービスAthenaを試した。Athenaはスキャン料に応じた従量制の為、列試行のデータストレージParquet形式のファイルとCSVとのRun Time 、スキャン量の比較を行った。列を指定すればParquetのスキャン量が少ないはず
最近のコメント