데이터 시각화/Power BI

[실습] 타이타닉 생존자 시각화 : 01. 데이터 소개 및 생존률 계산

zzheng 2024. 10. 9. 23:44

1. 데이터 소개

  • PassengerId : 승객 고유번호
  • Survived : 생존 여부
  • Pclass : 객실 등급
  • Name :이름 
  • Sex : 성별
  • Age : 연령
  • SibSp : 같이 탑승한 형제/자
  • Parch : 동반 부모/자식 수
  • Ticket : 티켓 고유 넘버
  • Fare : 요금
  • Cabin : 객실 번호
  • Embarked : 승선한 항구(총 3개)

2. 데이터 전처리

  • Ticket열 형식 변경하기 : 형식변경 --> 텍스트 형식으로 변경
  • Cabin열, Age열 null값 빈값으로 채우기 : 값바꾸기 --> 찾을값을 null, 바꿀 항목은 빈칸(Cabin열)/ 0(Age열)

3. 생존률 계산하기

새 측정값 클릭 --> 

  • 생존자 수 계산
    • 생존자 수 = SUM(titanic(Survived))
    • 생존자수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=1))
  • 사망자수 계산
    • 사망자수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=0))
  • 전체고객 수 계산
    • 전체고객수(CNT) = CALCULATE(COUNT('titanic'[PassengerId]), FILTER('titanic', 'titanic'[Survived]=0||1))
    • 전체고객수(ROW) = COUNTROWS('titanic')

생존률 계산 결과

 

4. 테이블로 확인하기

테이블 만들고, 열에서 '요약 안함' 클릭 후 확인하기

결과