20회 기출문제
실기 시험일자
2021.03.27
머신러닝 1
데이터셋
데이터 미리보기
| row | year | month | day | week | temp_2 | temp_1 | average | actual | forecast_noaa | forecast_acc | forecast_under | friend |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 2016 | 1 | 1 | Fri | 45 | 45 | 45.6 | 45 | 43 | 50 | 44 | 29 |
| 1 | 2016 | 1 | 2 | Sat | 44 | 45 | 45.7 | 44 | 41 | 50 | 44 | 61 |
| 2 | 2016 | 1 | 3 | Sun | 45 | 44 | 45.8 | 41 | 43 | 46 | 47 | 56 |
| 3 | 2016 | 1 | 4 | Mon | 44 | 41 | 45.9 | 40 | 44 | 48 | 46 | 53 |
| 4 | 2016 | 1 | 5 | Tues | 41 | 40 | 46.0 | 44 | 46 | 46 | 46 | 41 |
데이터 설명
- 문제 주제: 날씨 최고온도 예측
- 종속변수:
actual temp_1: 전날 최고온도temp_2: 전전날 최고온도friend: 친구의 예측온도
1-1
- 데이터 EDA를 수행하라.
- 결측치를 확인하고 처리 방안에 대해 논의하라.
- 데이터 분할 방법을 설명하라.
- 최종 데이터셋이 적절함을 주장하라.
1-2
- Random Forest를 학습하고 예측 결과를 해석하라.
- 예측 결과를 검정하고 중요변수를 도출하라.
- 변수 중요성을 분석하고 그래프로 출력하라.
1-3
- SVM을 학습하고 예측 결과를 해석하라.
- 예측 결과를 검정하고 해석하라.
- 변수 중요성 분석 가능 여부와 한계를 설명하라.
1-4
- Random Forest와 SVM 결과를 비교한 뒤 최종 모델을 선택하라.
- 두 모델의 장단점을 분석하고 운영 관점에서 어떤 모델을 선택할지 설명하라.
- 모델링 관련 추후 개선 방향을 제시하라.
머신러닝 2
데이터셋
데이터 미리보기
| row | houseCode | date | power consumption |
|---|---|---|---|
| 0 | house_01 | 2050-01-14 21:00:00 | 57.559877591292455 |
| 1 | house_26 | 2050-01-02 19:10:00 | 59.726880077815515 |
| 2 | house_25 | 2050-01-13 07:20:00 | 6.558823207433487 |
| 3 | house_20 | 2050-01-26 04:55:00 | 58.51458912444545 |
| 4 | house_09 | 2050-01-18 22:50:00 | 5.717008689346497 |
2-1
- 각 가구의 15분 간격 전력량 합을 구하라.
- 해당 데이터를 바탕으로 총 5개의 군집으로 군집화를 수행하라.
- 군집 결과를 지정된 형태로 출력하라.
- 군집화를 위한 데이터 구성 이유를 설명하라.
2-2
- 2-1의 데이터를 바탕으로 각 군집의 요일별, 15분 간격별 전력사용량 합을 구하라.
- 군집별 전력 사용 패턴을 히트맵으로 시각화하라.
머신러닝 3
데이터셋
데이터 미리보기
| row | TIMESTAMP | BIOGAS | BIOMASS | GEOTHERMAL | Hour | SMALL HYDRO | SOLAR | SOLAR PV | SOLAR THERMAL | WIND TOTAL |
|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 2012-11-26 00:00:00 | 208.0 | 354.0 | 926.0 | 1.0 | 208.0 | nan | 0.0 | 0.0 | 57.0 |
| 1 | 2012-11-26 01:00:00 | 207.0 | 354.0 | 927.0 | 2.0 | 207.0 | nan | 0.0 | 0.0 | 76.0 |
| 2 | 2012-11-26 02:00:00 | 208.0 | 353.0 | 927.0 | 3.0 | 208.0 | nan | 0.0 | 0.0 | 100.0 |
| 3 | 2012-11-26 03:00:00 | 208.0 | 350.0 | 927.0 | 4.0 | 209.0 | nan | 0.0 | 0.0 | 111.0 |
| 4 | 2012-11-26 04:00:00 | 209.0 | 352.0 | 927.0 | 5.0 | 209.0 | nan | 0.0 | 0.0 | 131.0 |
데이터 설명
- 문제 주제: 태양광 발전량 예측
- 예측 변수:
SOLAR PV
3-1
- 데이터셋을 7:3으로 분할하라.
- 데이터 전처리를 수행하고 예측 모델을 생성하라.
- 모델 성능을 RMSE, R제곱, 정확도로 평가하라.
- 정확도는 문제에서 제시한 식을 사용하고, 분모가 0인 경우는 0.5로 처리하라.
- 최종 결과는 소수점 셋째 자리에서 반올림하라.
Next Step
문제를 확인했다면 바로 실기 워크스페이스로 넘어가세요
기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.