데이터 과학의 업무 프로세스 문제 정의 problem definition 현실의 구체적인 문제를 명확하게 표현하고 통계적, 수리적 언어로 번역하는 작업 데이터 정의 data definition 변수variable, 지표metric 등을 정의한다. 실험 계획 design of experiment 혹은 표본화 sampling - 어떤 처리의 효과를 알아내기 위한 통제실험 randomized controlled experiment - 모집단을 대표하는 표본을 얻기 위한 표본화 sampling→ 필요한 정확도와 검정력을 얻기 위한 표본 크기가 중요 데이터 취득 data acquisition 다양한 형태의, 다양한 시스템에 저장된 원데이터를 분석 시스템으로 가져오는 활동 데이터 가공 data processing,..