我常常要query几个billion条记录的datasets,每次都至少要45分钟以上得到结果(remote) 。我昨天晚上用VPN联上database,噩梦,用了差不多2个小时。我在想,可不可以优化一下我的code让速度提高一点。比如说,
Proc sql;
Create table A as
Select ….
From DB1 inner join DB2 on a.keyword=b.keyword
Where controls;
Quit;
改成
Proc sql;
Create table A as
Select ……
From DB1 where controls and keyword in ( select keyword from B );
Quit;
这样会不会快一点?各位高大还有没有什么优化的高招?在些多谢啦。
我用SAS/SQL,我想基本原理跟SQL是一样的吧?