본문 바로가기

자격증

(3)
[ADsP 요약정리]3과목 (1) - 데이터 마트, 접촉값, 이상값 [1. 데이터 마트]▶ 데이터 마트(DM)- 데이터 웨어하우스의 한 분야로 특정 목적을 위해 사용- 소규모 데이터 웨어하우스 ▶ 요약변수와 파생변수- 데이터마트에 데이터들을 올리기 위해 필요한 변수 1) 요약변수- 데이터를 집계하여 분석을 간소화하는 데 사용- 데이터의 전반적인 패턴을 통계적 대표값으로 요약하는 역할- 수집된 정보를 종합한 변수- 재활용성이 높음 1-2) 주요 특징- 대표값 계산평균, 합계, 최소값, 최대값, 분산, 표준편차 등의 요약값 생성ex) 고객별 연간 구매액 평균, 전체 중 특정 제품의 구매 비율- 데이터 간소화데이터를 요약하여 분석 속도와 효율성 향상- 활용성데이터 마트와 같은 집계 데이터 구조에서 활용2) 파생변수- 기존 데이터를 가공하거나 변환하여 새로운 정보를 생성하는 변..
[ADsP 요약 정리]2과목 - 데이터분석 기획 [1. 데이터분석 기획의 이해]▶ 데이터 분석의 정의- 어떤 목표를 달성하기 위해 어떤 데이터를 가지고 어떤 방식으로 수행할지에 대한 계획을 수립하는 작업이다.- 실제 분석을 수행하기 전에 분석을 수행할 과제의 정의 및 의도했던 결과를 도출할 수 있는 방안을 사전에 계획하는 작업이다. ▶ 의미 있는 분석을 위해 분석가에게 요구되는 역량- 해당 문제 영역에 대한 전문성- 통계학적 지식을 활용한 분석 능력- 데이터 프로그래밍 기술[분석 기획 방향성 도출] ▶ 분석 대상과 방법- 분석 방법과 대상에 따라 4 가지 유형으로 나눌 수 있다. 1) 최적화 (Optimization)분석 대상과 분석 방법을 이해하고 현제의 문제를 최적화한 형태로 수행한다.내가 먹고 싶은 것을 알고(Known) 요리 방법도 안다면(..
[ADsP 요약 정리]1과목 - 데이터 이해 [1. 데이터의 이해][데이터의 정의]1) 데이터- 있는 그대로의 객관적 사실- 가공되지 않은 상태 [데이터의 특성]존재적 특성데이터는 있는 그대로의 객관적 사실이다.당위적 특성데이터는 추론, 예측, 전망, 추정을 위한 근거이다. 2) 정보- 데이터를 가공한 자료 → 체온 39도, 기침, 근육통, 인후통 이라는 "데이터"를 가공해서 코로나라는 "정보"를 만들어낸다. [데이터의 유형]1) 정성적, 정량적 - 정성적 데이터자료의 특징을 풀어서 설명한다.언어, 문자 등 규격화가 되지 않은 데이터를 말한다.날씨가 좋다, 그는 잘생겼다, 그건 비싸다 등 저장, 검색, 분석을 하는데에 있어 정성적 데이터보다 고도의 기술력이 요구되며 돈이 많이 든다.- 정량적 데이터자료를 수치화한다. 수치, 기호, 온도. 풍속 등으..