2020年8月3日 | そう備忘録

日付アーカイブ: 8月 3, 2020

0

列指向のデータストレージ形式、Apache Parquetについてもう少しだけ詳しく調べてみた

オープンソースの列指向のデータストレージ形式 Apache Parquetについて少しだけ詳しく調べてみた。AWS Athena(SQLを使用したS3でのデータクエリ)でCSVとParquetとのRun Time、Scan量の違いを比較してScan量が抑えられか検証した。