데이터 시각화/Power BI
[실습] 타이타닉 생존자 시각화 : 01. 데이터 소개 및 생존률 계산
zzheng
2024. 10. 9. 23:44
1. 데이터 소개
- PassengerId : 승객 고유번호
- Survived : 생존 여부
- Pclass : 객실 등급
- Name :이름
- Sex : 성별
- Age : 연령
- SibSp : 같이 탑승한 형제/자
- Parch : 동반 부모/자식 수
- Ticket : 티켓 고유 넘버
- Fare : 요금
- Cabin : 객실 번호
- Embarked : 승선한 항구(총 3개)
2. 데이터 전처리
- Ticket열 형식 변경하기 : 형식변경 --> 텍스트 형식으로 변경
- Cabin열, Age열 null값 빈값으로 채우기 : 값바꾸기 --> 찾을값을 null, 바꿀 항목은 빈칸(Cabin열)/ 0(Age열)
3. 생존률 계산하기
새 측정값 클릭 -->
- 생존자 수 계산
- 생존자 수 = SUM(titanic(Survived))
-
생존자수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=1))
-
사망자수 계산
-
사망자수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=0))
-
- 전체고객 수 계산
- 전체고객수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=0||1))
- 전체고객수(ROW) = COUNTROWS('titanic')
4. 테이블로 확인하기
테이블 만들고, 열에서 '요약 안함' 클릭 후 확인하기