기타/ADSP

[ADSP 정리] (과목 1) 제 1장 데이터의 이해

data-data-science 2020. 1. 14. 23:56

과목 1 데이터의 이해

 

제 1절 데이터와 정보 

  1. 데이터의 정의

  • 데이터 = 객관적 사실 (fact, raw material, 존재적 특성) + 당위적 특성 (추론 예측 전망 추정을 위한 근거 basis로 기능) 
    • 객관적 사실로서의 데이터 - 정성적, 정량적 
      • 정성적 데이터 (qualitative data, 비정형 데이터) : 언어, 문자 등으로 기술되는 데이터 
        • ex) 회사 매출이 증가함
        • 형태와 형식이 정해져 있지 않고 천차만별 (비정형 데이터) -> 저장, 검색, 분석에 상대적으로 많은 비용, 기술 투자 수반 
      • 정량적 데이터 (quantitative data) : 수치, 기호, 도형으로 표시되는 데이터 
        • ex) 30(나이), 48.4(kg) 
        • 양이 크게 증가하더라도 관리하는 시스템에서 저장, 검색, 분석하여 활용하기 용이 
  • 지식경영) 암묵지와 형식지의 상호작용 
    • 암묵지 (tacit knowledge) : 학습과 체험을 통해 개인에게 습득된, 겉으로 드러나지 않은 지식
      • 시행착오와 오랜 경험을 통해 개인이 습득한 무형의 지식 
      • 개인에게 체화 -> 공유 어려움 
    • 형식지 (explicit knowledge) : 형상화된 지식 ex) 교과서 
      • 유형의 대상 있음 -> 지식 전달과 공유가 용이
    • 경영학 관심 = 조직원 개인의 지식을 공유하고 발전시키는 것 
      • --> for 현장 경험으로 개인에서 내면화된 internalization 지식을 조직의 지식으로 공통화 socialization, 
        • 암묵지를 언어, 기호, 숫자 등의 형태로 표출화 externalization 
        • 이를 개인 본인의 지식에 연결 combination, 새로운 경험 부가, 다시 내면화, 상호작용 
      • 암묵지 = 내면화 internalization -> 공통화 socialization 
      • 형식지 = 표출화 externalization -> 연결화 combination 

2. 데이터와 정보의 관계 

  • 데이터의 당위적 특성에 주목 
  • DIKW 피라미드 (Data, Information, Knowledge, Wisdom hierarchy) : 데이터, 정보, 지식을 통해 최종적으로 지혜 얻어내는 과정 설명 
    • 1) 데이터 (data) : 존재형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호 의미 / 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실 
    • 2) 정보 (information) : 데이터의 가공 및 상관관계간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터 / 데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출된 것 
    • 3) 지식 (knowledge) : 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물 / 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류, 개인적 경험로 결합시켜 고유 지식으로 내재화한 것 
    • 4) 지혜 (wisdom) : 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적인 아이디어 / 지식의 축적과 아이디어가 결합된 창의적 산물 
  • 데이터의 정확성은 향후 데이터 간의 관계 및 현상 분석(정보), 적용(지식), 더 나아가 미래 예측, 창의적 산물 도출(지혜)에 영향 미침 

제 2절 데이터베이스 정의와 특징 

1. 용어의 연역 

  • 처음 등장 : 미국 정부, 자국의 군대의 군비 상황 집중 관리 위해, '데이터의 기지' 
  • 미국 SDC : 데이터베이스 용어 공식적 사용, 정보 쉽게 검색 / 시스템을 통한 체계적 관리와 저장 등의 의미를 담은 '데이터베이스 시스템' 용어 등장 
  • 최초의 현대적 의미의 데이터베이스 관리 시스템 IDS (Integrated data store) 

2. 데이터베이스의 정의 

  • 데이터베이스 = 쳬계적으로 정렬된 데이터 집합  
    • 데이터 양, 이용 증가 -> 대용량 데이터, 컴퓨터 기반으로 진화 
  • DBMS : 이용자가 쉽게 데이터베이스를 구축하고 유지할 수 있도록 하는 소프트웨어 
  • 데이터베이스 시스템 = 데이터베이스 + DBMS
  • 공식 정의 
    • 데이터베이스 = 문자, 기호, 음석, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집 축적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체 
    • 콘텐츠 = 다양한 의미전달 매체에 의하여 표현된 데이터, 정보, 지식, 저작물 등의 인식 가능한 모든 자료 

3. 데이터베이스의 특징 

  • 데이터베이스의 특징 
    1. 통합된 데이터 (integrated data) : 동일한 내용의 데이터가 중복 X 
    2. 저장된 데이터 (stored data) : 자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장됨, 컴퓨터 기술 바탕 
    3. 공용 데이터 (shared data) : 여러 사용자가 서로 다른 목적으로 데이터베이스 데이터를 공동 이용, 일반적으로 대용량화, 구조 복잡
    4. 변화하는 데이터 : 저장하는 내용 = 데이터베이스의 한 상태, 새로운 데이터의 삽입, 기존 데이터 삭제, 갱신으로 항상 변화하면서도 항상 현재의 정확한 데이터를 유지해야 한다. 
  • 데이터베이스의 특성 - 다양한 측면에서 
    1. 정보의 축적 및 전달) 대량의 정보를 일정한 형식에 따라 컴퓨터 등의 정보처리기기가 읽고 쓸 수 있도록 하는 기계가독성, 다양한 방법으로 필요 정보를 검색할 수 있는 검색가능성, 정보통신망을 통하여 원거리에서도 즉시 온라인으로 이용할 수 있는 원격조작성 
    2. 정보 이용 측면) 이용자의 정보 요구에 따라 다양한 정보를 신속하게 획득할 있고 원하는 정보를 정확하고 경제적으로 찾아볼 수 있음
    3. 정보 관리 측면) 정보를 일정 질서와 구조에 따라 정리, 저장하고 검색, 관리할 수 있도록 하여 방대한 양의 정보를 체계적으로 축적하고 새로운 내용 추가나 갱신이 용이
    4. 정보기술 발전의 측면) 데이터베이스는 정보처리, 검색,관리 소프트웨어, 관련 하드웨어, 정보 전송을 위한 네트워크 기술 등의 발전을 견인할 수 있음 
    5. 경제, 산업적 측면) DB는 다양한 정보를 필요에 따라 신속하게 제공, 이용할 수 있는 인프라로서의 특성 -> 경제, 산업, 사회 활동의 효율성 제고, 국민의 편의 증진 

제 3절 데이터베이스의 활용 

여기는 그냥 읽고 넘어갈 것임, 따로 정리 X