mir.pe (일반/밝은 화면)
최근 수정 시각 : 2024-09-24 15:19:12

빅데이터분석기사

컴퓨터 분야 자격증
{{{#!wiki style="margin: 0 -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -6px -1px -11px"
<colbgcolor=#f5f5f5,#333> 국가기술자격
기술사 정보관리기술사 | 컴퓨터시스템응용기술사 | 정보통신기술사
기사 정보처리기사 | 정보보안기사 | 전자계산기조직응용기사 | 전자계산기기사 | 빅데이터분석기사 | 로봇소프트웨어개발기사 | 임베디드기사 | 정보통신기사
산업기사 정보처리산업기사 | 정보보안산업기사 | 사무자동화산업기사 | 컴퓨터응용가공산업기사 | 전자계산기제어산업기사 | 정보통신산업기사
기능사 정보처리기능사 | 정보기기운용기능사 | 전자계산기기능사 | 컴퓨터응용선반기능사 | 컴퓨터응용밀링기능사 | 전자캐드기능사
컴퓨터그래픽스운용기능사 | 웹디자인기능사 | 전자출판기능사
서비스 전자상거래관리사 | 전자상거래운용사 | 컴퓨터활용능력 | 멀티미디어콘텐츠제작전문가 | 게임국가기술자격 | 전산회계운용사 | 한글속기 | 워드프로세서 | 사회조사분석사
민간자격
공인 전산세무회계 | ERP정보관리사 | AT 자격시험 | IT+정보활용능력인증 | 네트워크관리사1) | PC정비사 | 리눅스마스터 | SQLD | SQLP | RFID GL/SL | e-Test | ITQ | GTQ/ GTQi | DIAT | PC활용능력평가 | PC Master(정비사) | IEQ | 데이터아키텍처 | 데이터분석 전문가/준전문가( ADP/ ADsP) | SW테스트전문가3)
등록 SW코딩자격 | AIFB | 문서실무사 | COS Pro | 한글플러스 | 엑셀플러스 | 파워포인트플러스 | CAS활용능력 | 디지털영상편집 | 수사속기 | 코딩활용능력
국제 ICDL | MOS | OCJP | OCP | SCEA | CC | CISA | CISSP | ACE Test | ACP | PMP
※ 부분공인민간자격은 공인민간자격에만 기재하고 따로 주석을 첨부함.
1) 네트워크관리사는 2급만 국가공인자격임. (1급은 등록민간자격)
2) GTQ 및 GTQi는 1급/2급만 국가공인자격임. (GTQ/GTQi 3급 및 GTQid는 등록민간자격)
3) SW테스트전문가는 일반등급만 국가공인자격임. (고급은 등록민간자격)
}}}}}}}}}

{{{+2 {{{#FFFFFF 정보기술 분야 자격증}}}}}}
- - 빅데이터분석기사 -
- 사무자동화산업기사 - -
- - 전자계산기조직응용기사 -
- - - 정보관리기술사
정보기기운용기능사 - - -
정보처리기능사 정보처리산업기사 정보처리기사 -
- - - 컴퓨터시스템응용기술사
- 정보보안산업기사 정보보안기사 -

빅데이터분석기사
빅데이터分析技士
Engineer Big Data Analysis
중분류 211. 정보기술
관련부처 과학기술정보통신부
통계청
시행기관 한국데이터산업진흥원
1. 개요2. 상세
2.1. 신설2.2. 기본정보2.3. 시험정보
2.3.1. 응시자격 2.3.2. 합격기준 및 기타2.3.3. 필기
2.3.3.1. 빅데이터 분석 기획2.3.3.2. 빅데이터 탐색2.3.3.3. 빅데이터 모델링2.3.3.4. 빅데이터 결과 해석
2.3.4. 실기
2.3.4.1. 제공환경2.3.4.2. 검정과목
3. 논란 및 사건사고4. 기타5. 공부 요령6. 둘러보기

1. 개요

자격시험 소개 사이트

2019년 창설된 대한민국 기사등급 국가기술자격.
주무부처는 과학기술정보통신부 통계청이며 검정시행기관은 한국데이터산업진흥원(K-DATA)이다.

4차 산업혁명 시대를 맞아 빅데이터분석 전문인력 공급에 주력하기 위해 개발되었다. 빅데이터와 관련하여 관심과 수요가 증가한데 반해 필요한 역량, 기술, 지식 등의 기준 없이 수많은 민간 자격증이 난립하고 있는 상황을 해결하기 위해 신설되었다.

한국데이터산업진흥원에서 시행하는 ADP, ADsP와 빅데이터분석기사는 모두 시험 내용이 유사하지만 각 난이도에 차이가 있다. ADsP < 빅데이터분석기사 < ADP 순으로 실기시험이 없는 ADsP가 가장 쉽고, ADP는 빅데이터분석기사보다 훨씬 어려운 실기시험이 출제된다. 빅데이터분석기사를 취득했다면 ADsP는 중복이라 필요없지만 ADP 응시자격을 갖추기 위해 응시할 수도 있다[1].

빅데이터분석기사 시험은 2021년 4월 17일 첫 시험을 치렀고, 1년에 2회 실시한다. 자격증에는 과학기술정보통신부장관 통계청장이 적혀 나온다. 자격증은 상장형과 카드형 실물자격증으로 발급된다. 카드형은 2023년부터 발급이 가능해졌으며 발급비용으로 약 6천원 정도를 받는다. 발급까지는 약 2주 정도 소요된다.

2. 상세

2.1. 신설

[ 공고문 보기 ]
파일:20200131_101351_671.jpg

수탁기관 심의결과 2020년 1월 28일부로 2020년 12월 31일까지 약 1년간 한국데이터산업진흥원이[2] 빅데이터 분석기사 수탁기관으로 지정되었다. 관련 공지에 따르면 주무부처가 수탁기관 변경을 요청하지 않으면 자동 연장된다고 써있는 것으로 보아 계속 한국데이터산업진흥원이 수탁업무를 수행할 것으로 보인다.

2.2. 기본정보

2.3. 시험정보

2.3.1. 응시자격 [4]

다음 중 하나에 해당하는 사람 (※ 졸업증명서 및 경력증명서 제출 필요)

2.3.2. 합격기준 및 기타

2.3.3. 필기

구분 과목명 배점
1과목 빅데이터 분석기획 25
2과목 빅데이터 탐색 25
3과목 빅데이터 모델링 25
4과목 빅데이터 결과 해석 25

시험 방식은 객관식, 각 과목당 20문제로 구성되어 있다. 시험 시간은 총 120분이다. 과목당 8문제 이상을 맞혀야 하며, 한 과목이라도 8문제 미만으로 맞힐 경우 총점이 평균 60점 이상이라도 과락으로 불합격이다. 문제는 공개하지 않으며, 시험장에서 시험지를 걷어간다. 현행 기사 제도에서는 유일한 필기 비공개 시험이다. [5][6] 최초 시행된 2021년 제2회 필기시험에서는 예상보다 통계 관련 문제가 많이 나와 수험생들을 멘붕에 빠트렸다. 합격률이 한 자릿수가 아니냐는 의견도 나왔으나 필기 합격률은 40%대로 꽤 높은 편이다.
2.3.3.1. 빅데이터 분석 기획
주요항목 세부항목 세세항목
빅데이터의 이해 빅데이터 개요 및 활용 빅데이터의 특징
빅데이터의 가치
데이터 산업의 이해
빅데이터 조직 및 인력
빅데이터 기술 및 제도 빅데이터 플랫폼
빅데이터와 인공지능
개인정보 법·제도
개인정보 활용
데이터 분석 계획 분석 방안 수립 분석 로드맵 설정
분석 문제 정의
데이터 분석 방안
분석 작업 계획 데이터 확보 계획
분석 절차 및 작업 계획
데이터 수집 및 저장 계획 데이터 수집 및 전환 데이터 수집
데이터 유형 및 속성 파악
데이터 변환
데이터 비식별화
데이터 품질 검증
데이터 적재 및 저장 데이터 적재
데이터 저장
2.3.3.2. 빅데이터 탐색
주요항목 세부항목 세세항목
데이터 전처리 데이터 정제 데이터 정제
데이터 결측값 처리
데이터 이상값 처리
분석 변수 처리 변수 선택
차원축소
파생변수 생성
변수 변환
불균형 데이터 처리
데이터 탐색 데이터 탐색 기초 데이터 탐색 개요
상관관계 분석
기초통계량 추출 및 이해
시각적 데이터 탐색
고급 데이터 탐색 시공간 데이터 탐색
다변량 데이터 탐색
비정형 데이터 탐색
통계기법 이해 기술통계 데이터요약
표본추출
확률분포
표본분포
추론통계 점추정
구간추정
가설검정
2.3.3.3. 빅데이터 모델링
주요항목 세부항목 세세항목
분석모형 설계 분석절차 수립 분석모형 선정
분석모형 정의
분석모형 구축 절차
분석 환경 구축 분석 도구 선정
데이터 분할
분석기법 적용 분석기법 회귀분석
로지스틱 회귀분석
의사결정나무
인공신경망
서포트벡터머신
연관성분석
군집분석
고급 분석기법 범주형 자료 분석
다변량 분석
시계열 분석
베이지안 기법
딥러닝 분석
비정형 데이터 분석
앙상블 분석
비모수 통계
2.3.3.4. 빅데이터 결과 해석
주요항목 세부항목 세세항목
분석모형 평가 및 개선 분석모형 평가 평가 지표
분석모형 진단
교차 검증
모수 유의성 검정
적합도 검정
분석모형 개선 과대적합 방지
매개변수 최적화
분석모형 융합
최종모형 선정
분석결과 해석 및 활용 분석결과 해석 분석모형 해석
비즈니스 기여도 평가
분석결과 시각화 시공간 시각화
관계 시각화
비교 시각화
인포그래픽
분석결과 활용 분석모형 전개
분석결과 활용 시나리오 개발
분석모형 모니터링
분석모형 리모델링

2.3.4. 실기

실기 프로그램은 R(프로그래밍 언어) 또는 Python 중에서 수험자가 직접 선택하여 응시 가능하다. 시험 시간은 180분.
필기는 과목마다 과락이 있으나, 실기는 3유형인데도 과락이 없어, 특정 유형을 0점 맞아도 패스가 가능하며, 실제로 합격 인증사진을 보면 3과목 0점자들이 꽤 많다. 통계모듈을 사용할 줄 몰라도 합격이 가능하다는 말이다.

제5회 실기시험까지 단답형 10문제(각 3점씩)와 데이터 전처리 능력을 보는 작업형1 3문제(각 10점씩), 제공되는 데이터를 전처리하여 예측 모델링을 수행하는 작업형2 1문제(40점)가 출제되었으나, 제6회 실기시험부터는 단답형 10문제가 없어지고 가설검정 능력을 평가하는 작업형3 2문제(30점)가 출제된다. 총점 60점을 넘으면 합격한다.

실제 6회 시험에서는 작업형3 문제가 3문제 출제되었고, 출간된 교재나 강의에서 다루는 범위가 아닌 회귀 문제도 나왔다.
문제 오류로 인해서 전원 정답처리된 문제가 2문제 가량 있었는데, 시험 유형 자체가 자리를 잡지 못하고 매번 유형이 바뀌고 있는 점이 수험생들에게는 난이도 떡상의 요인이 될 것으로 보인다.

작업형3 문제를 풀기 위해서는 통계학 개론 수준의 내용은 알고 있어야 하는 만큼 철저한 통계검정에 대한 준비가 필요하다.

7회 시험에서는 작업형 1과 작업형 2는 무난하게 나왔고 이전 기출과 비슷한 난이도로 출제된 것으로 보인다.
작업형 3 문제에서는 파이썬 기준 scipy 라이브러리 안에 있는 stats 모듈로는 도저히 풀 수 없는 문제들만 나왔고, statsmodels 모듈을 알아야 풀 수 있는 문제만 출제되었다. 출제 기조가 statsmodels 모듈만을 활용할 수 있어야 문제를 풀 수 있는 방향으로 변모하였다.
2.3.4.1. 제공환경
클라우드 기반 코딩 플랫폼이 제공된다. 특징이라면 시각화 패키지가 제공되지 않는다. Jupyter Notebook처럼 셀 혹은 줄 단위로 실행시킬 수 없고, 전체 코드를 한 번에 실행해야 한다. 또한 자동완성 기능도 제공되지 않으므로 유의할 것. 즉 코드를 완벽하게 외워야 한다.[7]코드 실행시간은 최대 1분이며, 1분을 넘기면 자동 실행취소된다. 아래 링크의 환경을 참고.
2.3.4.2. 검정과목
검정과목은 1개로 '빅데이터 분석 실무'이며 주요 항목은 아래와 같다.

3. 논란 및 사건사고

- 작업형2 채점오류 사태: 실기 작업형2 1문제 같은 경우 응시자들의 점수가 만점(40점)과 0점이라는 극단적인 분포로 갈라져 있으며, 파이썬으로 코드를 제출한 경우가 만점이 많고 R로 코드를 제출한 경우가 0점이 많은 것으로 나타났다. 이는 시스템 오류 때문인 것으로 밝혀졌고, 이에 대해 당시 긴급공지가 올라왔다. 진흥원 측에서는 전수조사를 실시한 결과를 수험자 개별로 문자를 발송하여 변동 여부를 통보하였으며, 사전사후 검사결과를 비교할 수 있도록 공개할 것임을 공지하였고 실기 재검토 결과를 안내하였다. 관련공지1 관련공지2 진흥원에 직접 방문하여 코드 확인을 한 사례가 존재한다. 방문 후기 이 글에서처럼 코드 실행 시간의 1분 준수 여부가 매우 큰 제약점으로 작용하였으며, 향후 시험을 준비하는 수험생들이 반드시 염두에 두어야 할 사항이다. 무능원이라는 말이 돌 정도로 여러 가지 측면에서 주관기관 대응이 미흡한 점이 눈에 띄며, 빅분기 역시 큐넷으로 이관하는 것이 좋겠다는 의견이 수험생들 사이에서 전반적으로 돌고 있다.
이 채점 번복 사태는 2021년 국정감사에도 소환됐다. [국감2021] 불합격→합격 489명··· K-DATA, 허술한 시험관리 논란 채점 프로그램의 오류 때문으로 드러났으며, 2000여 명 중 489명이 불합격에서 합격으로, 19명이 합격에서 불합격으로 합격여부가 번복됐다.

4. 기타

종목 개발 연구에 따르면 ADsP ADP 사이의 수준이다.

2020년에 정보처리기사가 개정되어 난이도가 올라가자 정보처리기사를 징검다리 삼아 다른 기사 응시자격을 갖추려던 비전공자들이 전자계산기조직응용기사나 빅데이터분석기사를 대신 보겠다고 하기도 했다. 하지만 빅데이터 분야가 상당한 통계학 지식을 요구하는지라 비전공자가 접근하기엔 어려울 것으로 보인다.

시험마다 다르긴 하나, 매 시험 응시자는 약 6천명이며, 최종합격자는 2천명 정도인 듯하다. 4회 시험까지는 필기 합격률이 50%가 안 되었으나 5회부터는 60% 정도로 올라왔고, 대신에 실기시험 합격률이 약 60%에서 50%정도로 하락했다.

5. 공부 요령

역사가 오래되지 않은데다 문제를 공개하지 않다보니 응시자들의 기억에 의존하여 문제가 복원된 것이 전부여서 준비하는 것이 영 순탄치 않은 시험이다. 게다가 위 사건사고에서 보다시피 출제오류나 문항오류도 빈번해 수험생들의 원성이 자자하다. 출제경향도 시험에 따라 들쑥날쑥하다는 평가가 있었으나, 점점 안정화되고 있다는 평도 있다.

필기시험은 기출복원문제를 구해서 여러번 보되, 최소 한 번은 교재를 훑어보는 게 좋다. 48문제를 맞힐 수 있도록 한다.

실기시험은 구름이라는 IDE 환경에서 실시하는데, 케글/코랩/주피터 노트북 등에서 연습을 하다가 시험장에서 처음 써보면 구리고 안 되는 게 많아서 매우 당황스러울 수 있다. 셀 단위 실행이 불가능하고, UI도 매우 다르다. 그러니 사전에 시험환경 체험 페이지를 이용하여 연습해보는 것을 권장한다.

또한 구름에서 데이터프레임 등이 길어지면 ...으로 표기되므로 전체를 보여주도록 하는 코드, 경고 등을 무시하도록 하는 코드, 코드를 잊어버렸을 때를 대비해 dir이나 help 등의 사용법을 익혀두는 것이 좋다.

연습문제는 온라인으로 공유되는 사이트가 많으므로 그것을 찾아보면 좋다.

무려 40점이 걸려있는 작업형 2유형의 팁이라면, 풀기 전 분류 문제와 회귀 문제인지 구분하는 것이 중요한데, 문제에 적힌 성능 지표를 보면 분류 문제인지 회귀 문제인지 구분하기 쉽다. 그리고 실제 머신러닝을 돌리는 것과 시험장은 차이가 크다. 시험환경의 한계로 1분 내 코드가 반드시 동작되어야 하므로 성능을 올리기 위한 길고 복잡한 코드는 추천되지 않는다.
하이퍼 파라미터 등을 튜닝하기 위해 복잡한 코드를 쓰는 것보다 전처리 후 단순히 모델 두세 개 정도를 디폴트 값으로 돌려보고 가장 모델링 점수가 좋은 것으로 제출하는 것이 좋다. 시험장에서 사용할 모델로서 무난한 것은 선형회귀, 로지스틱회귀, 랜덤포레스트, XGBoost 정도며, 가장 많이 사용되는 것은 '랜덤포레스트'이다. 여러 모델의 코드를 아는 것보다 한 가지라도 제대로 공부하는 것을 추천한다. 모델에 따라 인코딩 방법이 달라지거나 스케일링 등을 생략할 수 있으므로 성능이나 시간관리에 있어 모델을 제대로 아는 것은 매우 중요하다. 작업형 2유형의 경우 기본적인 것들만 제대로 해도 만점을 받는 사례가 많다.

3유형의 경우 가설검정이나 통계분석이 나오는데, 6회부터 추가된 유형인데다 내용이 방대하여 대비하기 어려운 면이 있다. 시험장에서 프로그램을 바꿔 사용하는 것도 가능하므로 두 가지 툴 모두 사용할 줄 안다면 머신러닝은 파이썬으로, 통계분석은 R로 하는 것도 가능하다.

시중에 판매되는 수험서들은 기출문제도 제각각으로 실제랑 다르게 복원하기도 하고, 풀이가 상이하게 다르다. 실기 유형이 처음에는 4회까지는 필기 주관식이었고, 실기 제2유형을 채점하는 난이도가 까다로워지고 있어서, 저자들도 제대로 된 답을 알지 못하는 상태에서 수험서를 썼기 때문에, 똑같이 했다가는 틀릴 수도 있다.

6. 둘러보기

🏬 사회과학 조사·연구 방법론 둘러보기
{{{#!wiki style="margin: 0px -10px -5px; min-height: 26px"
{{{#!folding [ 펼치기 · 접기 ]
{{{#!wiki style="margin: -5px -2px -11px"
<colbgcolor=#C1F3FF>📝 서론 <colbgcolor=#F7FFFF,#191919> 사회과학 · 과학적 방법 · 사회조사 · 연구 · 가설 · 이론( 이론적 조망) · 연구윤리
🔍 조사방법론 I 변인 · 정의 · 상관관계와 인과관계 · 실험( 실험설계 · 통제 · 통제집단과 실험집단) · 사례연구
자료 · 자료수집( 면접법 · 초점집단면접법 · 질문지법 · 관찰법) · 코딩
📈 조사방법론 II 표본조사 · 지표 · 측정 · 신뢰도와 타당도 · 지수 · 척도
📊 사회통계 통계적 방법 · 기술통계학 · 확률 및 분포 · 추론통계학 · SPSS · 분석기법( 분산분석 · 회귀분석)
👔 공인 자격증 사회조사분석사 · 빅데이터분석기사 · 국가공인 데이터분석 전문가
📂 메타 문서 연구방법론 관련 정보
상기 문서들은 한국통계진흥원 및 한국산업인력공단의 출제범위에 의거하여 엄격히 망라되어 있으며, 동 기관의 과목별 구분·명명에 의거하여 조사방법론은 2파트로 구분됨
}}}}}}}}} ||



[1] ADsP 합격자는 ADP 응시자격을 준다. 빅데이터 분석기사는 해당사항이 없다 [2] ADP, ADsP, SQLP, SQLD 등의 데이터 관련 자격증 시험을 주관 [3] 본디 기사 시험 응시 자격은 관련 학과 학사 학위(또는 취득 예정자), 또는 현업에서 일정 기간 이상의 종사를 요구한다. 그러나 " 국가기술자격의 종목별 관련학과 고시"( #)에서 '정보기술' 분야에 포함되는 정보관리기술사, 컴퓨터시스템응용기술사, 전자계산기조직응용기사, 정보처리기사, 정보보안기사, 빅데이터분석기사, 사무자동화산업기사, 정보처리산업기사, 정보보안산업기사의 8개 자격은 모든 학과가 응시 가능하다. 즉, 4년제 대학교만 졸업하면 관련 학과를 졸업했다고 인정한다는 의미이다. [4] 국가기술자격법 시행령 별표4의2 [5] 타 기사시험도 인터넷에서는 공개하지 않으나, 문제지를 회수하지 않아 각종 웹사이트에서 시험문제가 공유된다. [6] 2021년까지 정보보안기사도 비공개였지만 2022년 KCA 한국방송통신전파진흥원으로 이관되면서 공개되었다. [7] help나 dir 등은 사용가능함. [8] 즉 빅분기는 사실상 2회시험이 초대 시험이다. [9] 연도별 월평균을 구하는 문제였다. [10] 대신 시험장에서 설치 패키지를 볼 수 있는 명령어가 제공됐다. [11] 7회부터는 답안제출 방식도 변경되었으며, 메모장도 시스템에 내장된 메모장만 쓸 수 있도록 변경됐다.

분류