230510 수요일 학습 주제 - 데이터 웨어하우스와 SQL 기본에 대해 배우고 이를 바탕으로 데이터 분석에 대해 학습 (3) GROUP BY와 Aggregate 함수 GROUP BY는 Aggregate 함수와 함께 사용한다. 많이 쓰이는 Aggregate 함수에는 COUNT, SUM, AVG, MIN, MAX, LISTAGG 함수 등이 있다. 이들은 테이블의 레코드를 그룹핑하여 그룹별로 다양한 정보를 계산할 때 사용하는데 이때 두 단계를 거쳐 생각하고 사용할 수 있다. 1. 먼저 그룹핑할 필드를 결정한다. 이때 하나 이상의 필드가 될 수 있다. ex) GROUP BY 1,2,... 2. 그룹별로 계산할 내용을 결정하고 적절한 Aggregate 함수를 사용한다. 간단한 사용 예제 두 가지를 살펴보자. -..
230509 화요일 학습 주제 - 데이터 웨어하우스와 SQL 기본에 대해 배우고 이를 바탕으로 데이터 분석에 대해 학습 (2) 실습에 대하여 AWS 콘솔을 통해 Redshift cluster를 launch 하는 방법을 배웠다. 그리고 강사님께서 launch 하신 cluster에 접근하여 다양한 실습들을 해보는데 이때 사용할 예제 테이블에 대해 전달받았다. 웹서비스 사용자/세션 정보가 들어있는 테이블인데 이는 사용자 트래픽 분석이 가능하고 마케팅에 바로 직결되는 부분이다 보니 매우 흥미롭게 느껴졌다. 데이터를 다루기 전 기억할 것! - 항상 데이터를 믿을 수 있는지 의심할 것 => 실제 레코드를 몇 개 살펴보기(노가다) => 중복된 레코드 체크! => 최근 데이터의 존재 여부 체크!(freshness) =..