빅데이터란 무엇일까요 ? 빅데이터의 개념과 뜻에 대해 자세히 알려드립니다.
빅데이터의 개념
온라인 사전에 따르면 빅데이터는 '기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석의 기능을 넘어서 대량의 정형 혹은 비정형 데이터 세트로부터 가치를 추출하고 결과를 도출하는 기술'이라고 정의하고 있습니다.
다시 말해, 빅데이터란 매우 방대한 분량의 데이터일 뿐만 아니라 해당 데이터의 분석과 활용을 모두 포괄하는 개념인 것입니다.
일반적으로 빅데이터는 정형화, 반정형화, 비정형 데이터 등으로 구분할 수 있습니다. 매년 통계청에서 발표하는 정량적인 데이터가 정형화 데이터라면, 문서 작성 등을 통해 작성된 것이 바로 반정형화 데이터이며, 비정형의 데이터란 개인과 개인 혹은 개인과 집단이 주고 받는 상호작용의 결과물일 것입니다.
빅데이터의 구성 요소
빅데이터는 보통 5개의 요소로 구성되어 있으며 이를 5V라고 일컫습니다.
1. 규모(Volume)
해가 지날수록 우리가 접하는 데이터의 정보량은 무한하게 늘어나고 있습니다. 빅데이터의 첫번째 구성요소는 바로 데이터의 양(규모)입니다.
2. 다양성(Variety)
특히 비정형화된 데이터의 경우 데이터가 텍스트로만 이루어져 있지 않습니다. 데이터의 종류와 유형이 매우 다양합니다.
3. 속도(Velocity)
오늘날 빅데이터를 통칭하는 무한대의 데이터가 오고가는 속도의 양은 엄청납니다. 대규모의 데이터는 사실상 실시간에 가까울 정도로 다양한 매체를 통해 생성되고 저장되며, 수집됩니다.
4. 정확성(Veracity)
빅데이터를 분석할 경우 양질의 데이터, 즉 정확성과 신뢰도가 높은 데이터를 활용하는 것이 분석 결과에 긍정적인 영향을 줄 수 있습니다.
5. 가치(Value)
빅데이터를 분석하는 과정의 최종 목표는 새로운 가치 창출입니다. 만약 사회에 어떠한 문제가 발생했을 경우 관련 데이터를 수집하고 분석하여 이를 해결할 수 있는 유의미한 결과를 도출해야 합니다.
함께 보면 도움되는 글
2023.05.15 - [고급 찌라시] - [재무제표 상식] 유동자산, 유동비율, 당좌비율의 뜻 총정리!
2023.06.01 - [고급 찌라시] - 반도체 기업의 종류 완벽 정리(IDM, 팹리스, 파운드리 등)
댓글