23회 기출문제
실기 시험일자
2021.12.18
머신러닝 1
데이터셋
데이터 미리보기
| row | date | Temperature | Humidity | Light | CO2 | HumidityRatio | Occupancy |
|---|---|---|---|---|---|---|---|
| 0 | 2015-02-02 14:19:59 | 23.718 | 26.29 | 578.4 | 760.4 | 0.0047726609921251 | 1 |
| 1 | 2015-02-02 14:22:00 | 23.7225 | 26.125 | 493.75 | 774.75 | 0.0047437733559968 | 1 |
| 2 | 2015-02-02 14:23:00 | 23.754 | 26.2 | 488.6 | 779.0 | 0.0047665939999861 | 1 |
| 3 | 2015-02-02 14:23:59 | 23.76 | 26.26 | 568.666666666667 | 790.0 | 0.0047793324316345 | 1 |
| 4 | 2015-02-02 14:25:59 | 23.754 | 26.29 | 509.0 | 797.0 | 0.0047830937083903 | 1 |
1-1
데이터 EDA 수행 후, 분석가 입장에서 의미 있는 탐색을 수행하라.
1-2
결측치를 대체하는 방식을 선택하고 근거를 제시한 뒤 대체를 수행하라.
1-3
추가적으로 데이터의 질과 품질관리를 향상시킬 수 있는 내용을 작성하라.
1-4
데이터에 불균형이 있는지 확인하고, 불균형 판단 근거를 작성하라.
1-5
오버샘플링 방법 2개를 선택하고 장단점과 선정 이유를 설명하라.
1-6
오버샘플링을 수행하고 결과가 잘 되었는지 판단하라.
1-7
속도 측면 모델 1개와 정확도 측면 모델 1개를 선택하고, 선택 이유를 기술하라.
1-8
오버샘플링한 데이터 2개와 오버샘플링 전 데이터 1개에 대해 모델 2개를 적용하고 성능을 보여주라.
1-9
위 예측 결과를 사용해 오버샘플링이 미친 영향에 대해 작성하라.
통계 1
데이터셋
데이터 미리보기
| row | name | life span |
|---|---|---|
| 0 | sample1 | 10000 |
| 1 | sample2 | 9000 |
| 2 | sample3 | 9500 |
| 3 | sample4 | 10000 |
| 4 | sample5 | 10000 |
1-1
귀무가설과 연구가설을 세워라.
1-2
유효한 데이터의 개수를 구하라.
1-3
검정통계량과 연구가설 채택 여부를 작성하라.
통계 2
데이터셋
데이터 미리보기
| row | location | date | new_cases |
|---|---|---|---|
| 0 | Austria | 2021-01-01 | 2096.0 |
| 1 | Austria | 2021-01-02 | 1391.0 |
| 2 | Austria | 2021-01-03 | 1466.0 |
| 3 | Austria | 2021-01-04 | 1642.0 |
| 4 | Austria | 2021-01-05 | 2311.0 |
2-1
각 나라의 일자별 누적확진자 수를 나타내는 데이터프레임을 생성하라.
2-2
누적확진자 데이터로 국가별 ACF를 구하고, lag 50까지의 값에서 첫 번째 값을 제외한 뒤 유클리디안 거리를 기준으로 군집화하여 덴드로그램을 작성하라.
통계 3
Next Step
문제를 확인했다면 바로 실기 워크스페이스로 넘어가세요
기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.
