[정보처리기사 실기-7] 이것만 보면 합격-DB 구성요소 및 특성, DBMS 특성 및 종류, 빅데이터 특성, 데이터마이닝, NoSQL
<8회>
※ DB : 다수의 인원, 시스템, 프로그램이 사용할 목적으로 통합 관리되는 데이터의 집합
※ DB 4요소 : 통저공운
- 통합된 데이터 : 자료 중복 X
- 저장된 데이터 : 저장매체에 저장
- 공용 데이터 : 여러 시스템이 공동으로 사용
- 운영 데이터 : 업무수행에 반드시 필요한 데이터
※ DB 특성 : 실계내동
- 실시간 접근성
- 계속적인 변화
- 내용 참조
- 동시 공용
※ DBMS : 데이터 추가,변경,검색,삭제,백업,복구,보안 등 기능을 지원하며 데이터 관리의 복잡성을 해결하는 데이터베이스 관리시스템
※ DBMS 종류 : 계키문그
- 계층형 DBMS : 데이터를 상하 종속적 관계로 관리되는 DBMS
- 키-값 DBMS : 키 기반의 DBMS
- 문서저장 DBMS : 데이터 타입이 문서 타입의 DBMS
- 그래프 DBMS : 그래프로 데이터를 표현하는 DBMS
※ DBMS 특징 : 효보일무회
- 효율성 : 요구 조건 만족시켜야함
- 보안성 : 보안성 좋아야 함
- 일관성 : 삽입,삭제,갱신,생성 후 동일한 데이터여야 함
- 무결성 : 동일한 내용엔 동일한 데이터여야 함
- 회복성 : 문제발생시 롤백가능해야 함
※ 빅데이터 : 시스템에서 주어진 비용, 시간내에 처리 가능한 데이터를 넘어서는 PB 단위 이상의 비정형 데이터
※ 데이터 마이닝 : 대규모 데이터 안에서 통계적 규칙이나 패턴을 찾아내는 기술
※ 데이터마이닝 3규칙 : 분연연
- 분류규칙 : 과거 데이터로부터 특성을 찾아내여 분류모형을 만들어 결과값 예측
- 연관규칙 : 데이터 안에서 연관성(종속관계)을 찾아내는 기법
- 연속규칙 : 연관규칙 + 시계열 정보가 추가된 기법
※ 텍스트 마이닝 : 대량의 텍스트로부터 패턴이나 관계를 찾아내는 기법
※ 하둡 : 대용량 데이터 처리를 위해 설계된 분산 파일 시스템
※ 맵리듀스 : 구글의 대용량 데이터 처리를 위한 SW프레임워크
※ 빅데이터 특성 (3V) : Volume, Variety, Velocity
※ NoSQL : 데이터 저장에 고정된 테이블 스키마가 필요없이 수평적으로 확장이 가능한 DBMS
※ NoSQL 특성 : BA, SS, EC
- Basically Available : 언제든지 데이터 접근 가능 (가용성)
- Soft-State : 노드의 상태는 외부에서 전송된 정보를 통해 결정됨 (특정시점에서 일관성 보장 X)
- Eventually Consistency : 일정 시간이 흐르면 데이터의 일관성이 보장되야 함
※ Column Family Data Store : 키 안에 Column-Value 조합으로 된 여러개 필드를 갖는 NoSQL 유형
※ 온톨로지 : 세상에 존재하는 모든 개념, 속성, 관계정보를 컴퓨터가 이해할 수 있는 형태로 표현한 모델