23회 기출문제

실기 시험일자

2021.12.18

머신러닝 1

데이터셋
데이터 미리보기
rowdateTemperatureHumidityLightCO2HumidityRatioOccupancy
02015-02-02 14:19:5923.71826.29578.4760.40.00477266099212511
12015-02-02 14:22:0023.722526.125493.75774.750.00474377335599681
22015-02-02 14:23:0023.75426.2488.6779.00.00476659399998611
32015-02-02 14:23:5923.7626.26568.666666666667790.00.00477933243163451
42015-02-02 14:25:5923.75426.29509.0797.00.00478309370839031
1-1

데이터 EDA 수행 후, 분석가 입장에서 의미 있는 탐색을 수행하라.

1-2

결측치를 대체하는 방식을 선택하고 근거를 제시한 뒤 대체를 수행하라.

1-3

추가적으로 데이터의 질과 품질관리를 향상시킬 수 있는 내용을 작성하라.

1-4

데이터에 불균형이 있는지 확인하고, 불균형 판단 근거를 작성하라.

1-5

오버샘플링 방법 2개를 선택하고 장단점과 선정 이유를 설명하라.

1-6

오버샘플링을 수행하고 결과가 잘 되었는지 판단하라.

1-7

속도 측면 모델 1개와 정확도 측면 모델 1개를 선택하고, 선택 이유를 기술하라.

1-8

오버샘플링한 데이터 2개와 오버샘플링 전 데이터 1개에 대해 모델 2개를 적용하고 성능을 보여주라.

1-9

위 예측 결과를 사용해 오버샘플링이 미친 영향에 대해 작성하라.

통계 1

데이터셋
데이터 미리보기
rownamelife span
0sample110000
1sample29000
2sample39500
3sample410000
4sample510000
1-1

귀무가설과 연구가설을 세워라.

1-2

유효한 데이터의 개수를 구하라.

1-3

검정통계량과 연구가설 채택 여부를 작성하라.

통계 2

데이터셋
데이터 미리보기
rowlocationdatenew_cases
0Austria2021-01-012096.0
1Austria2021-01-021391.0
2Austria2021-01-031466.0
3Austria2021-01-041642.0
4Austria2021-01-052311.0
2-1

각 나라의 일자별 누적확진자 수를 나타내는 데이터프레임을 생성하라.

2-2

누적확진자 데이터로 국가별 ACF를 구하고, lag 50까지의 값에서 첫 번째 값을 제외한 뒤 유클리디안 거리를 기준으로 군집화하여 덴드로그램을 작성하라.

통계 3

데이터셋
주어진 분포표
  • 학점 1.5-2.5: 사회과학 15, 자연과학 25, 공학 10
  • 학점 2.5-3.5: 사회과학 60, 자연과학 69, 공학 77
  • 학점 3.5-4.5: 사회과학 24, 자연과학 5, 공학 13
  • 원본 이미지:
3-1

귀무가설과 연구가설을 세워라.

3-2

학과와 성적이 독립일 경우의 기댓값을 구하라.

3-3

검정통계량을 구하고 연구가설 채택 여부를 작성하라.

Next Step

문제를 확인했다면 바로 실기 워크스페이스로 넘어가세요

기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.