列指向のデータストレージ形式、Apache Parquetについてもう少しだけ詳しく調べてみた
オープンソースの列指向のデータストレージ形式 Apache Parquetについて少しだけ詳しく調べてみた。AWS Athena(SQLを使用したS3でのデータクエリ)でCSVとParquetとのRun Time、Scan量の違いを比較してScan量が抑えられか検証した。
オープンソースの列指向のデータストレージ形式 Apache Parquetについて少しだけ詳しく調べてみた。AWS Athena(SQLを使用したS3でのデータクエリ)でCSVとParquetとのRun Time、Scan量の違いを比較してScan量が抑えられか検証した。
最近のコメント