cool hamsters never sleep

[Part 2. 기획역량] 요약본 본문

2022 Bigdata Class/Note

[Part 2. 기획역량] 요약본

슈슈 susu 2022. 9. 17. 19:44

1장. 디자인씽킹 기반 문제 해결 방법론

1. 디자인씽킹

1) 개념 : 고객의 문제에 대한 공감 -> 정의 -> 아이디어 도출 -> 프로토타입 개발의 과정을 거쳐 해결책을 도출하는 사고 과정

2) 특성 : 공감, 통합적 사고, 낙관주의, 실험주의, 협업

3) 핵심 원리 : 분석적 사고 + 직관적 사고, 수렴과 확산의 원리

 

 

2장. 디자인씽킹 기반 문제 해결 방법론 (워크샵)

1. 창의적 생각

2. 브레인스토밍 기법을 활용한 문제 정의

3. 해결방안 도출 (페르소나와 고객 여정 지도)

4. 프로토타이핑

 

 

3장. 공공 빅데이터 분석 과제 기획 (BizDriven/DataDriven)

1. (Biz Driven) 업무 중심의 문제 정의와 주제 도출

1) 단계 : 비전 방향 검토

2) 단계 : 업무분석 개선요소 / 해결안 도출

3) 단계 : 빅데이터 활용 주제 도츨

 

2. (Data Driven)

1) 단계 : 데이터 확인

2) 단계 : 내외부 수요과제 도출

3) 단계 : 데이터와 수요 과제 이용 과제 설계

 

3. 외부 데이터 MashUp

1) 단계 : 데이터 확인

2) 단계 : 결합 효과성 검증

3) 단계 : 데이터로부터 개념적 수준의 설계

 

4. 빅데이터 과제 종합 기획

1) 빅데이터 분석을 위한 주제를 정하여 기술

2) 과제의 목적을 기술

3) 과제의 필요성을 기술 (사실적인 내용, 근거가 있는 내용조사 및 정량적 지표 3개 이상 도출)

4) 주요 내용 : 분석 및 만들고자 하는 서비스 등에 대해서 구체화하여 정리

5) 활용 데이터 : 내부/외부, 정형/비정형 구분 기술, 데이터 소스에 대한 내용 기술

6) 기대효과 및 활용방안 : 기대효과를 3가지 관점 이상으로 정리하여 기술

7) 모의분석 : 중요한 부분, 가시성있고 효과성있는 분석의 방향을 사전에 보여준다는 측면으로 접근

 

 

4장. 공공 빅데이터 시각화 이해

1. 빅데이터 시각화 이해

1) 개요 : 광범위하게 분산된 방대한 양의 자료를 분석해 한 눈에 볼 수 있도록 도표나 차트로 정리하는 것

- 효과 : 정보 습득 시간 절감으로 즉각적인 상황 판단 가능, 흥미 유발과 정보의 빠른 확산 촉진, 자료 기억에 도움

- 이용 : 분석 모델의 설계 단계, 분석 결과의 표현/전달 단계에서 사용

- 활용목적 : 탐색적 문제 해결 (EDA), 현상의 해석 (Description), 시각적 스토리텔링

- 프로세스 : 정보의 구조화 -> 정보의 시각화 -> 정보의 시각 표현

 

2) 도구 : 엑셀, Tableau, D3JS, Tensorflow, R, Q-GIS 등

- 인포그래픽는 빅데이터 시각화라고 할 수 없음

 

3) 원리

- 전주의적 속성에 대한 이해 필요 (의식적으로 노력하지 않아도 한눈에 패턴을 알아채는 시각적 속성)

- 데이터 속성에 대한 이해 필요

 

4) 이해

- 시각화 관점에서의 데이터 유형 분류

구분 유형 개념
수치형 데이터 / 정량적 데이터 연속형 데이터 측정가능한 계량치 (시간, 온도, 무게, 길이 등)
이산형 데이터 계수치 (불량품 수, 사고건수, 매출액 등)
범주형 데이터 순서형 데이터 순서 존재 (학점, 평가등급, 선호도, 년도 등)
명목형 데이터 순서 없고 동등한 우선순위 (지역, 성별, 메뉴, 분야, 업종 등)

- 점 그래프 (산포도, 점 도표) : x축에 범주형과 수치형 데이터 모두 사용 가능 

- 선 그래프 : 연속되는 데이터의 변화 (트렌드) 보는데 주로 사용

- 막대 그래프 : 최소/최대 항목 찾을 때 흔히 사용, 여러 값의 상대적 차이를 한눈에 확인 가능

- Boxplot (분포)

- Histogram (빈도)

 

2. 빅데이터 시각화 기법

1) 시간 시각화 : 시간에 걸쳐 진행되는 변화 또는 트렌드 추적에 사용

- 막대 그래프

- 누적 막대 그래프

- 점 그래프

 

2) 비율 (분포) 시각화 : 전체의 관점에서 부분 간의 관계 분석

- 파이차트

- 도넛차트

- 트리맵 (Tree 구조 분석)

- 누적 연속 그래프

 

3) 관계 시각화 : 데이터간 상관관계 분석

- 스캐터 플롯

- 버블 차트 (3개 변수)

- 히스토그램

 

4) 비교 시각화 : 많은 변수와 세부 분류의 전체적 비교

- 히트맵

- 체르노프페이스

- 스타차트

- 평행좌표계

- 다차원척도법

 

5) 공간시각화

 

3. 유의점

1) 보는 사람의 관점에서 이해 (모두 다르므로 강조점 표현)

2) 데이터 속성과 활용 목적에 따른 그래프 선택

3) 해석과 시사점이 빠진 그래프는 무의미

4) 지도 그래프가 항상 좋은 것은 아니므로, 통계 그래프와 같이 사용

 

 

5장. 공공 빅데이터 분석 방법론

1. 데이터 분석, 활용 개요

1) 활용 방향 ★ : Reactive (문제발생 이후 처리) -> Predictive (예측적), Preventive (예방적)

2) 분석 과정 단계 : 분석 주제 기획 -> 데이터 분석 단계 -> 업무 적용 단계

 

2. 데이터 분석 방법론 이해

1) 수학적 모델 : 모델의 검증 및 해석 중요 (수치 값들의 의미에 대한 해석)

2) 시각화 그래프 : 그래프 해석 (의미있게 해석되었는지 업무적 검증)

 

3. 공공 분야 데이터 분석, 활용 Case Study

1) 서비스 개발 전 데이터 값 중심의 검증 단계 실시

2) 값 데이터의 출처 의심

3) 데이터의 순수성 의심

4) 데이터의 가치 의심

5) 데이터의 양이 아니라 맥락이 더 중요

Comments