230509 화요일 학습 주제 - 데이터 웨어하우스와 SQL 기본에 대해 배우고 이를 바탕으로 데이터 분석에 대해 학습 (2) 실습에 대하여 AWS 콘솔을 통해 Redshift cluster를 launch 하는 방법을 배웠다. 그리고 강사님께서 launch 하신 cluster에 접근하여 다양한 실습들을 해보는데 이때 사용할 예제 테이블에 대해 전달받았다. 웹서비스 사용자/세션 정보가 들어있는 테이블인데 이는 사용자 트래픽 분석이 가능하고 마케팅에 바로 직결되는 부분이다 보니 매우 흥미롭게 느껴졌다. 데이터를 다루기 전 기억할 것! - 항상 데이터를 믿을 수 있는지 의심할 것 => 실제 레코드를 몇 개 살펴보기(노가다) => 중복된 레코드 체크! => 최근 데이터의 존재 여부 체크!(freshness) =..
230508 월요일 학습 주제 - 데이터 웨어하우스와 SQL 기본에 대해 배우고 이를 바탕으로 데이터 분석에 대해 학습 (1) 관계형 데이터베이스(RDB, Relational DataBase)란? 구조화된 데이터를 저장하고 질의할 수 있도록 해주는 스토리지이다. 관계형 데이터베이스를 조작하는 프로그래밍 언어가 SQL이다. 관계형 데이터베이스는 프로덕션 데이터베이스와 데이터 웨어하우스로 나누어진다. 프로덕션 데이터베이스 - MySQL, PostgreSQL, Oracle - OLTP(Online Transcation Processing) - 빠른 속도에 집중, 서비스에 필요한 정보 저장 - 사용자용 데이터 웨어하우스 - Redshift, Snowflake, BigQuery, Hive - OLAP(Online..