빅데이터 플랫폼 개발자란?
최근 빅데이터와 빅데이터 취업에 대한
관심이 높아지고 있는데요.
그래서 오늘은 빅데이터, 빅데이터 플랫폼,
빅데이터 개발자에 대해 얘기해볼까 해요!
기존 데이터보다 방대하여 기존의 방법이나
도구로 수집/저장/분석 등이 어려운 정형 및
비정형 데이터들을 의미하고 크기(Volume),
속도(Velocity), 다양성(Variety)의 특징을
가지고 있습니다.
빅데이터의 크기는 일반적으로 수십 테라
바이트 혹은 수십 페타바이트 이상 규모의
데이터 속성을 의미하고 그 형태가
다양합니다.
IT 기술이 발달하면서 한꺼번에 처리가능한
데이터의 양이 늘어났고
과거에는 데이터분석이 숫자 중심이였다면
지금은 텍스트, 이미지, 동영상까지도
분석의 대상이 될 수 있는 시대가 왔습니다.
구글은 검색을 통해 확보한 데이터로
독감이 어느 지역까지 퍼졌는지를
사람들에게 실시간으로 알려줬습니다.
지역 인근에 전염병이 돌기 시작하면
그 지역 사람들이 그 병에 대해 검색하는
빈도가 높아지는 것을 보고
병이 어디까지 퍼졌는지를 알 수 있었고,
이 데이터는
많은 인원과 비용을 들여 수집한
미국 질병관리국 예측치 만큼
정확했다고 합니다.
다양한 데이터 소스에서 수집한
데이터를 처리 · 분석하여 지식을 추출하고,
이를 기반으로 지능화된 서비스를
제공하는 데 필요한 IT 환경을
빅데이터 플랫폼이라 합니다.
즉 빅데이터 기술을 잘 사용할 수 있도록
*준비된 환경을
빅데이터 플랫폼이라고 합니다.
*운영체제, 빅데이터 세부 기술의 집합체
빅데이터를 다루기 위해서는
분산처리 기술을 활용해야하며
이를 가능하게 하는 기술이
하둡(Hadoop)입니다.
하둡은 분산 응용 프로그램을 지원하는
프리웨어 자바 소프트웨어 프레임워크입니다.
대량의 데이터를 보관하고 분석하는 역할을
하기때문에 빅데이터 분야에 진입하기 위해
필수적으로 배워야 하는 것이죠.
하둡은 빅데이터 기술을 실현시키기 위한
다양한 기능들이 함께 내포되어 있어
'하둡 생태계(Hadoop Ecosystem)' 라고
부르기도 합니다.
빅데이터를 분석하기 위한 운영체제인
빅데이터 플랫폼을 개발하는 사람을
빅데이터 개발자라고 합니다.
또한, 빅데이터 플랫폼 개발자라고도 불립니다.
이상으로
빅데이터, 빅데이터 플랫폼&개발자에
대한 포스팅을 마치도록 하겠습니다.
COMMENT (0)개