TPC-DS数据集和query生成
1、生成100G数据:./dsdgen -scale100-dir /data并行:nohup ./dsdgen -scale 100 -dir /data/ -parallel 3-child 1 >nohup.log 2>&1 &nohup ./dsdgen -scale 100 -dir /data/ -parallel 3-child...
·
1、生成100G数据:
./dsdgen -scale 100 -dir /data
并行:
nohup ./dsdgen -scale 100 -dir /data/ -parallel 3 -child 1 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir /data/ -parallel 3 -child 2 >nohup.log 2>&1 &
nohup ./dsdgen -scale 100 -dir /data/ -parallel 3 -child 3 >nohup.log 2>&1 &
2、生成query:
修改tpl文件(query_templates目录下),增加一行:
define _END = "";
生成sql文件:
for id in `seq 1 99`; do ./dsqgen -DIRECTORY ../query_templates -TEMPLATE "query$id.tpl" -DIALECT netezza -FILTER Y > ./sql/"query$id.sql"; done

魔乐社区(Modelers.cn) 是一个中立、公益的人工智能社区,提供人工智能工具、模型、数据的托管、展示与应用协同服务,为人工智能开发及爱好者搭建开放的学习交流平台。社区通过理事会方式运作,由全产业链共同建设、共同运营、共同享有,推动国产AI生态繁荣发展。
更多推荐
所有评论(0)