티스토리 뷰

반응형

 

데이터 과학

데이터를 수집한 후 분석을 통해 데이터를 정확히 이해함으로써 그 속에 숨겨진 새로운 지식을 발견하고, 이를 문제 해결에 활용하는 모든 과정의 활동을 의미한다.

 

 

📚 DIKW 계층 구조

👉 데이터

     관찰하거나 측정하여 수집한 사실이나 값

 

👉 정보

     상황에 대한 이해를 바탕으로 데이터를 목적에 맞게 가공한 것

 

👉 지식

     규칙이나 패턴을 통해 찾아낸 의미 있고 유용한 정보

 

👉 지혜

     지식에 통찰력을 더해 새롭고 창의적인 아이디어를 도출한 것

 

 

데이터 과학의 특징

컴퓨터 과학, 통계학, 적용 분야에 대한 이해를 필요로 하는 복합적인 기술을 말한다.


빅데이터

좁은 의미로는 기존 데이터베이스가 저장하고 관리할 수 있는 범위를 넘어서는 대규모의 다양한 데이터를 뜻하고, 넓은 의미로는 대규모 데이터를 저장 및 관리하는 기술과 가치 있는 정보를 만들기 위해 분석하는 기술까지 포함한다.

 

 

🧭 빅데이터의 특징 : 3V

👉 데이터양

     테라바이트 단위 의상의 대량 데이터

 

👉 속도

     데이터의 수집과 분석을 정해진 시간 내에 처리해야 함

 

👉 다양성

     정형, 반정형, 비정형 같은 다양한 형태의 데이터를 모두 포함

 

 

 

빅데이터의 기술

  • 저장 기술

    하둡, NoSQL

  • 분석 기술

    텍스트 마이닝, 오피니언 마이닝, 소셜 네트워크 분석, 군집 분석

  • 표현 기술

    R 언어

 

 

 

 

 

좋아요는 로그인하지 않아도 누를 수 있습니다!

728x90
반응형
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/05   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
글 보관함