23회 기출문제

실기 시험일자

2021.12.18

머신러닝 1

데이터셋

데이터 경로: /api/problem-datasets/Datamanim/datarepo/main/adp/23/problem1.csv

데이터 미리보기

row	date	Temperature	Humidity	Light	CO2	HumidityRatio	Occupancy
0	2015-02-02 14:19:59	23.718	26.29	578.4	760.4	0.0047726609921251	1
1	2015-02-02 14:22:00	23.7225	26.125	493.75	774.75	0.0047437733559968	1
2	2015-02-02 14:23:00	23.754	26.2	488.6	779.0	0.0047665939999861	1
3	2015-02-02 14:23:59	23.76	26.26	568.666666666667	790.0	0.0047793324316345	1
4	2015-02-02 14:25:59	23.754	26.29	509.0	797.0	0.0047830937083903	1

1-1

데이터 EDA 수행 후, 분석가 입장에서 의미 있는 탐색을 수행하라.

1-2

결측치를 대체하는 방식을 선택하고 근거를 제시한 뒤 대체를 수행하라.

1-3

추가적으로 데이터의 질과 품질관리를 향상시킬 수 있는 내용을 작성하라.

1-4

데이터에 불균형이 있는지 확인하고, 불균형 판단 근거를 작성하라.

1-5

오버샘플링 방법 2개를 선택하고 장단점과 선정 이유를 설명하라.

1-6

오버샘플링을 수행하고 결과가 잘 되었는지 판단하라.

1-7

속도 측면 모델 1개와 정확도 측면 모델 1개를 선택하고, 선택 이유를 기술하라.

1-8

오버샘플링한 데이터 2개와 오버샘플링 전 데이터 1개에 대해 모델 2개를 적용하고 성능을 보여주라.

1-9

위 예측 결과를 사용해 오버샘플링이 미친 영향에 대해 작성하라.

통계 1

데이터셋

데이터 경로: /api/problem-datasets/Datamanim/datarepo/main/adp/23/problem2.csv

데이터 미리보기

row	name	life span
0	sample1	10000
1	sample2	9000
2	sample3	9500
3	sample4	10000
4	sample5	10000

1-1

귀무가설과 연구가설을 세워라.

1-2

유효한 데이터의 개수를 구하라.

1-3

검정통계량과 연구가설 채택 여부를 작성하라.

통계 2

데이터셋

데이터 경로: /api/problem-datasets/Datamanim/datarepo/main/adp/23/problem3_covid2.csv

데이터 미리보기

row	location	date	new_cases
0	Austria	2021-01-01	2096.0
1	Austria	2021-01-02	1391.0
2	Austria	2021-01-03	1466.0
3	Austria	2021-01-04	1642.0
4	Austria	2021-01-05	2311.0

2-1

각 나라의 일자별 누적확진자 수를 나타내는 데이터프레임을 생성하라.

2-2

누적확진자 데이터로 국가별 ACF를 구하고, lag 50까지의 값에서 첫 번째 값을 제외한 뒤 유클리디안 거리를 기준으로 군집화하여 덴드로그램을 작성하라.

통계 3

데이터셋

주어진 분포표

학점 1.5-2.5: 사회과학 15, 자연과학 25, 공학 10
학점 2.5-3.5: 사회과학 60, 자연과학 69, 공학 77
학점 3.5-4.5: 사회과학 24, 자연과학 5, 공학 13
원본 이미지:

3-1

귀무가설과 연구가설을 세워라.

3-2

학과와 성적이 독립일 경우의 기댓값을 구하라.

3-3

검정통계량을 구하고 연구가설 채택 여부를 작성하라.

Next Step

문제를 확인했다면 바로 실기 워크스페이스로 넘어가세요

기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.

이전24회 기출문제

다음22회 기출문제