Data Analysis

빅데이터와 데이터 과학

AubreyJeong 2021. 6. 2. 20:41

주니어 데이터 분석가/과학자로 전직을 준비할 때, 

다양한 분석 기법이나 분석 관련 업무 경력 및 데이터 해석력에 대한 질문도 많지만 우리가 흔히 사용하는 업계 용어에 대해 자신이 내린 정의에 대해 물어보기도 한다. 그 관점에서 '빅데이터'와 '데이터 과학'을 정의해보고자 한다.

 

빅데이터 Big data 의 정의

빅데이터는 단순히 대용량 데이터를 지칭하는 용어이기도 하지만, 

미국의 유명 IT 컨설팅업체인 가트너 Gartner Inc.에 따르면 빅데이터는 3V로 정의할 수 있다.

 

## 빅데이터의 3V 
1. High-Volume 대용량의 데이터 규모 (데이터의 기하급수적인 성장)
2. High-Velocity 빠른 입출력 속도 (데이터의 가용성)
3. High-Variety 다양성 (데이터의 정보화)

 

빅데이터의 관점에서 데이터 과학 Data Science 이란 "빅데이터를 분석하고 연구하는 학문"으로 이야기할 수 있다.

하지만, 필자가 생각하는 데이터 과학에 대한 정의는 이러하다. 

 

데이터 과학 Data Science 이란 

컴퓨터 도구를 효율적으로 이용하고, 적절한 통계학 방법을 사용하여 실제적인 문제에 답을 내리는 활동

 

따라서, 데이터 과학자/분석가란 '데이터에서 의미있는 정보를 도출하는 사람'이라고 할 수 있다.

데이터 과학자 및 분석가는 엄밀히 말하자면 업무 스코프가 "다른" 직업이지만, 

툴tool을 활용해서 데이터 안에서 가치를 찾는다는 관점에서는 그 결이 비슷하다고 생각한다.