- 빅데이터 (Bigdata)
빅데이터란 디지털 환경에서 생성되는 데이터로 그 규모가 방대하고, 생성 주기도 짧고, 형태도 수치 데이터 뿐 아니라 문자와 영상 데이터를 포함하는 대규모 데이터를 말한다. 빅데이터 환경은 과거에 비해 데이터의 양이 폭증했다는 점과 함께 데이터의 종류도 다양해져 사람들의 행동은 물론 위치정보와 SNS를 통해 생각과 의견까지 분석하고 예측할 수 있다.
- 스몰데이터 (Smalldata)
스몰데이터는 개인의 취향이나 필요, 건강 상태, 생활 양식 등 사소한 행동에서 나오는 정보들을 말한다. 개인에 대한 관찰을 통해 정확한 추리를 해내는 명탐정 셜록 홈스는 뛰어난 스몰데이터 분석가라고 할 수 있다. 이는 방대한 양의 디지털 데이터를 분석하는 빅데이터와는 접근 방식이 다르다.
- 정형데이터 (Structured data/formal data)
즉시 통계적 분석에 사용될 수 있을만한 형태로 정리되고 가공된 데이터를 의미한다. 고정된 필드에 저장된 데이터를 말하며 관계형 데이터베이스와 스프레드시트 등을 예로 들 수 있다.
- 비정형데이터 (informal data)
페이스북, 트위터 등 소셜 네트워킹 서비스(SNS, 누리 소통망 서비스)의 확산으로 데이터베이스에 잘 정리된 데이터가 아닌, 웹 문서, 이메일, 소셜 데이터 등 형식이 정해지지 않은 데이터를 비정형 데이터라 말한다. 현재 빅데이터의 85% 가량이 형태가 정해지지 않은 비정형 데이터이다.
- 반정형데이터 (semi-structured data)
비정형 데이터만큼 정리가 가공이 안되어 있지는 않지만, 일반적인 통계분석에 바로 사용할 수 있을 만큼 정제되어있지는 않은 데이터들을 말한다. 예를 들어 신문 기사나 서적의 텍스트 등이 이에 해당된다고 볼 수 있다.
COMMENT (0)개