17회 기출문제

실기 시험일자

2020.06.21

머신러닝 1

데이터셋

데이터 미리보기

row	Id	LotArea	LotFrontage	YearBuilt	1stFlrSF	2ndFlrSF	YearRemodAdd	TotRmsAbvGrd	KitchenAbvGr	BedroomAbvGr	GarageCars	GarageArea	price
0	1.0	8450.0	65.0	2003.0	856.0	854.0	2003.0	8.0	1.0	3.0	2.0	548.0	12.24769911637256
1	2.0	9600.0	80.0	1976.0	1262.0	0.0	1976.0	6.0	1.0	3.0	2.0	460.0	12.109016442313738
2	3.0	11250.0	68.0	2001.0	920.0	866.0	2002.0	6.0	1.0	3.0	2.0	608.0	12.317171167298682
3	4.0	9550.0	60.0	1915.0	961.0	756.0	1970.0	7.0	1.0	3.0	3.0	642.0	11.849404844423074
4	5.0	14260.0	84.0	2000.0	1145.0	1053.0	2000.0	9.0	1.0	4.0	3.0	836.0	12.429220196836384

데이터 설명

1-1

1-2

Train, Valid, Test set으로 분할하고 시각화를 제시하라.

1-3

2차 교호작용항까지 고려한 회귀분석을 수행하고 변수 선택 과정을 제시하라.

1-4

데이터셋

데이터 미리보기

row	location	date	total_cases	total_deaths	new_tests	population	new_vaccinations
0	Afghanistan	2020-02-24	5.0	nan	nan	39835428.0	nan
1	Afghanistan	2020-02-25	5.0	nan	nan	39835428.0	nan
2	Afghanistan	2020-02-26	5.0	nan	nan	39835428.0	nan
3	Afghanistan	2020-02-27	5.0	nan	nan	39835428.0	nan
4	Afghanistan	2020-02-28	5.0	nan	nan	39835428.0	nan

데이터 설명

2-1

2-2

2-3

데이터셋

데이터 미리보기

row	userid	group	Q1-1	Q1-2	Q1-3	Q1-4	Q2-1	Q2-2	Q2-3	Q2-4	Q3-1	Q3-2	Q3-3	Q3-4	Q4-1	Q4-2	Q4-3	Q4-4	Q5-1	Q5-2	Q5-3	Q5-4
0	0	A	5	2	1	2	4	5	3	3	4	4	1	1	5	2	5	3	3	4	3	4
1	1	A	2	2	3	3	4	3	1	4	4	2	2	3	4	3	5	3	1	2	1	1
2	2	A	1	3	4	4	2	1	4	4	4	4	4	2	1	3	4	1	3	3	2	5
3	3	A	3	3	4	2	2	4	4	3	2	4	2	3	3	4	2	4	1	1	3	2
4	4	A	3	1	2	3	4	3	4	1	1	3	5	1	3	2	3	1	3	2	5	4

데이터 설명

1-1

역문항을 변환한 후 각 그룹(A~~D)의 영역(Q1~~Q5)별 응답 평균, 표준편차, 왜도, 첨도를 구하라. 각 통계량은 4x5 데이터프레임 형태로 제시하라.

1-2

그룹별로 Q1-1 문항의 차이가 존재하는지 분산분석을 시행하라.

1-3

탐색적 요인분석을 수행하고 결과를 시각화하라.

Next Step

기출 문서를 읽은 뒤에는 동일한 ADP 실기 환경에서 바로 회차를 선택하고 코딩을 이어서 진행할 수 있습니다.