대메뉴로 바로가기 서브메뉴 바로가기 컨텐츠 바로가기

통합검색

추천검색어
SNS, ott, 5G,


home > KISDI 발간물 > 연구보고서 > 정책연구
확대 축소 프린트

정책연구

정부의 장·단기 정책 발굴 및 대안수립을 위한 연구 및 민간기관·단체 등으로 부터 위탁받아 수행한 연구 보고서입니다.

태그 ICT ,빅데이터 ,이슈 탐색 ,수출예측 ,교육수요

  • 트위터 보내기
  • 페이스북 보내기
  • 미투데이 보내기
  • 네이버 보내기
  • 구글 보내기
  • 메일 보내기
인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발
제목 인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발
저자 정용찬 ·정부연 조회 2674
게재지 정책연구 권호 정책연구 20-04-04
언어 KOR 페이지 1-168 (총 168 pages)
PDF pdf열기인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발 발행일 2020.02.28
분류정보 IT산업 > IT산업/시장
IT산업 > 인력/수요
본 연구의 목표는 타 분야에 비해 정형 빅데이터 분석이 취약했던 교육분야 연구에서의 빅데이터 분석 알고리즘의 활용과 머신러닝 기반 예측 모델을 구축하여 미래 예측 데이터의 가능성을 탐색하는데 있다.
본 연구는 인구 지형 변화와 산업구조 변화에 따른 고등교육기관 계열별 수요 예측 모델 개발을 연구 주제로 설정하고 빅데이터 분석과 머신러닝 기반 예측 방법론의 적용 가능성을 확인하고자 하였다. 이를 위해 대학 계열별 입학, 졸업, 중도탈락 등의 시계열적 변동 특성 분석과 대학 수요 예측모델 생성을 위한 기초 데이터 셋을 정의하고, 대학 계열별 수요 예측 모델 개발에 적합한 머신러닝과 AI 알고리즘을 분석하고, 머신러닝과 AI 알고리즘을 적용한 대학 계열별 수요 예측 모델의 생성 및 향후 수요 변화 예측치를 산출하는 연구를 수행하였다.
이 연구를 통해 향후 교육분야에서 예측이 필요한 다양한 주제에 대해 머신러닝, AI 기반 알고리즘을 적극 활용하여 의사결정이 될 수 있는 토대를 마련하고자 하며, 데이터 확보의 한계점 등 머신러닝, AI 기반 알고리즘을 교육 문제에 적용할 때에 발생할 수 있는 문제점을 분석하고 전문가들과의 협업을 통해 교육 정책 결정에 필요한 데이터 분석 플랫폼의 프로토타입을 제시하고자 한다.
본 연구의 주요 내용은 첫째, 과거 대학 정원 정책의 흐름과 계열별 입학지원자, 입학률, 졸업률, 중도탈락률의 흐름, 학령인구와의 상관관계를 살펴보고 수요 결정에 영향을 미치는 요인들간의 상관관계를 살펴본다. 둘째, 국외 주요국 고등교육정책 결정시의 빅데이터 활용 사례를 살펴보고 고등교육기관의 수요 결정 프로세스를 살펴본다. 셋째, 저출산, 학령인구 감소에 따른 대학의 자원 배분과 관련된 관련 연구를 찾고 각 연구에서 제시하는 데이터와 산출 방법을 정리하여 시사점을 도출한다. 넷째, 대학별, 지역별, 계열별 대학 정원의 과거 10년 혹은 15년간의 시계열 데이터를 확보하고 미래 직업 전망 데이터, 산업별 인력 수요 데이터 등 대학정원 결정에 영향을 미칠 수 있는 데이터 셋을 확보한다. 다섯째, 확보된 데이터 셋을 기반으로 머신러닝 알고리즘을 적용하여 모델 적합성을 점검한다. 개발된 고등교육기관 학과 계열별 산업수요예측 모델에 실제 데이터를 적용하여 각 계열별 산업수요 예측지수를 산출한다. 마지막으로 제안한 모델의 한계점을 살펴보고 정확성을 높일 수 있는 추가적 데이터와 향후 연구 방향을 제안한다.
본 연구의 결과를 요약하면 다음과 같다. 교육분야에서 진행된 빅데이터 관련 연구를 분석한 결과 교육분야에서 주로 사용되는 빅데이터 분석 방법은 대부분 이슈트랜드, 토픽 모델링 등 텍스트 마이닝 방법이 많아 활용되고 있는 것으로 나타났다. 또 정부부처, 공공기관 등에서 시행한 연구들을 살펴본 결과 타 분야의 연구에 비해 교육분야의 빅데이터, AI 관련 연구가 더딘 상황으로 파악된다.
교육분야의 빅데이터 AI 관련 연구를 국내 연구와 국외 연구로 나누어서 전체적인 연구의 흐름과 대표적인 연구 사례를 분석하였고 특히 유네스코에서 제안하고 있는 디지털 역량 프레임워크에 대해 살펴보았다. 또한 본 연구에서 제안하려고 하는 고등교육기관 수급과 관련된 연구를 살펴보고 이들 연구에서 제안하는 방안들에 대해 살펴보았다.
본격적인 데이터 분석의 첫 단계인 데이터 취득 단계에서는 고등교육통계 데이터, 대학정보공시 관련 데이터, 고등교육기관 졸업자 취업통계 데이터, 통계청 장래인구추계 데이터, 한국표준산업분류, 한국표준직업분류, 전국 사업체 조사, 산업별 사업체 노동력 조사, 산업별 지수데이터, 미래 유망 직업 15선, 미래직업 가이드북, 미래전망직업, 대학 어디가 등의 수집 방법과 구성 변수를 확인하고 활용 가능성을 살펴보았다.
분석에 활용할 데이터로 고등교육기관 교육통계 데이터, 고등교육기관 졸업자 취업통계 데이터, 통계청 전국 산업체 조사 데이터를 선정하고 기초 데이터를 획득하였다. 획득한 데이터의 탐색적 분석에서는 고등교육기관 교육통계 데이터를 기반으로 대학입학 적령 인구와 입학정원과의 시계열적 분포, 고등교육기관 연도별 입학지원자 수 변화, 고등교육기관 계열별 경쟁률의 시계열적 변화, 고등교육기관 연도별 지역별 경쟁률에 대한 탐색적 분석을 실시하였다. 고등교육기관 졸업자 취업통계 데이터를 기반으로 각 계열별 산업 대분류 중분류별 진출분야에 대한 탐색적 분석과 통계청 전국 사업체 조사 데이터를 기반으로 각 대분류별 중분류의 종사자수 변화추이, 사업체수 변화추이에 대한 탐색적 분석을 실시하였다.
탐색적 분석 대상이었던 세 종류의 데이터 중에 고등교육기관 졸업자 취업통계 데이터와 전국 사업체 조사 데이터를 기반으로 계열별 산업수요 예측모델을 구축했다. 먼저 전국 사업체 조사의 중계열별 종사자수의 시계열적 추이를 선형 회귀분석을 통해 산업별 전망 가중치를 구하고 이 가중치를 학과 중분류별로 취업한 취업자의 산업별 비중을 곱하여 계열별 산업수요 예측지수를 산출하였다.
계열별 산업수요 예측 모델 산출 결과 가장 산업수요가 높은 중계열 분야는 의료, 간호, 유아교육, 치료보건 등으로 나타났다. 특히 의약계열 분야와 교육계열 분야가 강세를 보이고 있는데 의약계열 전공이 주로 취업하는 보건업과 교육계열 전공이 주로 취업하는 교육 서비스업 산업의 전망이 높게 반영된 결과로 추정된다.
반면 산업 예측지수가 낮은 계열은 자연계열의 수학물리천문지리, 생물화학환경 전공과 공학계열의 화공, 소재재료 등으로 나타나는데 특히 화학과 소재재료 전공의 경우 취업률은 평균보다 높지만 이 두 전공이 종사하는 산업의 전망이 좋지 못하기 때문인 것으로 분석되었다.
본 보고서에서는 중분류 단위의 분석 결과를 기술하였으나 소계열, 세부학과까지 분석이 가능한 산업 수요 예측 분석 시스템 프로토타입을 제작하여 제시하였다. 이 시스템은 R의 shiny패키지를 사용하여 제작하였는데 고등교육기관 학과별 학생현황, 고등교육기관 계열별 취업현황, 산업분류, 계열별 산업별 취업현황 분석 등의 메뉴로 구성되어 각 중분류, 소분류별 데이터를 확인하고 그래프를 사용자 반응형으로 구현할 수 있도록 제작하였다.
본 연구에서 설계한 고등교육기관 산업수요 예측 모델과 산업수요 예측 분석 시스템 프로토타입은 향후 고등교육기관의 학과 개편, 교수 수급 등의 계획을 수립하는데 활용이 가능하다. 그동안 정책적으로 결정된 대학 정원 배정 과정에서 주로 활용한 데이터인 신입생 충원율, 교원 확보율 등과 함께 활용된다면 보다 정확한 고등교육기관 입학 정원 결정을 유도할 수 있을 것이다.
본 연구에서 고등교육기관 산업수요 예측모델에서 사용된 머신러닝 기법인 선형회귀분석 모형을 포함하여 다양한 머신러닝 알고리즘을 활용한다면 예측력이 높고 정확성이 높은 산업예측 지수를 산출할 수 있을 것이다.
예측력과 정확성이 높은 산업예측 지수를 산출하기 위해서는 다음과 같은 정책들이 필요할 것으로 보인다.
첫째, 교육분야의 빅데이터 분석 연구에 대한 투자가 과감하게 이루어질 필요가 있다. 교육분야의 빅데이터, AI 관련 연구는 타 분야에 비해 활성화되고 있지 못한데 교육부를 비롯한 교육관련 연구기관, 대학 등에서 빅데이터 관련 연구를 시행하고 결과를 공유하는 체제를 구축하여 연구자들간의 분석 결과, 분석 기법 등을 공유하여 증거기반 정책 수립의 기초 플랫폼으로 활용할 필요가 있다.
둘째, 데이터 플랫폼의 부재를 지적할 수 있다. 최근 데이터 3법의 통과에 따라 개인정보에 대한 수집과 분석이 수월해진 상황이기 때문에 데이터 분석이 효과적으로 이루어 질 수 있는 데이터 셋을 구축하여 제공하는 플랫폼의 구축이 필요하다. 연구자들이 수행하는 연구분야에 맞는 데이터 셋을 제공하고 자유롭게 분석연구를 실시할 수 있도록 보안이 갖추어진 네트워크 상의 분석 플랫폼의 구축이 필요하다. 다만 보안이 우수한 네트워크 상의 분석 플랫폼의 구축에는 많은 예산이 필요한 만큼 단계적으로 접근할 필요가 있다. 한국교육개발원은 한국교육개발원에서 보유하고 있는 다양한 데이터를 자유롭게 분석 할 수 있는 오프라인 플랫폼으로 ‘데이터 오픈 랩’을 운영하고 있다. 향후 ‘데이터 오픈 랩’은 온라인 상에서 자유로운 분석이 가능한 플랫폼으로의 발전적 재구축이 필요하다.
셋째, 빅데이터로 표현되는 대량의 양적 데이터도 중요하지만 질적 데이터에 대한 수집도 같이 진행되어야 한다. 대량의 양적 데이터를 기반으로 한 빅데이터 분석은 상관관계 분석에는 매우 훌륭한 분석 도구이지만 상관관계의 원인을 파악하는 인과관계 분석이 어렵다는 점이 단점으로 꼽히고 있다. 빅데이터 분석을 통해 분석된 상관관계의 원인을 밝히는 인과관계 분석을 위해서는 질적 데이터가 기반이 되어야 한다. 따라서 대량의 양적 데이터에 대한 중요성이 강조되는 만큼 질적 데이터에 대한 구축도 균형있게 논의되어야 빅데이터 분석의 효과성이 극대화 될 수 있을 것이다.
제1장 서 론

제1절 연구의 필요성
제2절 연구의 목적
제3절 연구의 내용
제4절 연구의 방법

제2장 이론적 배경 및 선행연구 분석

제1절 이론적 배경
1. 빅데이터, 데이터 과학, AI
2. 빅데이터와 AI를 활용한 데이터 분석 방법
제2절 선행 연구
1. 공공 분야에서의 빅데이터와 인공지능 관련 연구 사례
2. 교육분야의 빅데이터, AI 관련 연구
3. 대학정원 및 대학 학생 수급 관련 연구 현황
4. 미래의 직업과 산업 전망 관련 연구
5. 주요 선행연구와의 차별화

제3장 고등교육기관 데이터 현황

제1절 고등교육통계 데이터
1. 고등교육 관련 분야 자료
2. 고등교육통계 데이터 현황
3. 대학정보공시 관련 기초 데이터 수집 현황
제2절 고등교육기관 졸업자 취업통계 데이터
1. 고등교육기관 졸업자 취업통계 데이터 현황
2. 고등교육기관 졸업자 취업통계 데이터 가공
3. 고등교육기관 졸업자 취업통계 산업분야 관련 데이터 수집 현황
제3절 통계청 장래인구추계 데이터
1. 장래인구추계 개요
2. 장래인구추계 상의 고등교육 학령인구
제4절 산업 및 직업 분야 기초데이터 현황
1. 데이터 필요성
2. 산업 및 직업 분야 분류 기준 및 주요 통계 내역
3. 산업분야 데이터 현황
4. 직업분야 데이터 현황

제4장 데이터의 탐색적 분석

제1절 고등교육 데이터
1. 데이터 형태
2. 데이터 분석
제2절 고등교육기관 졸업자 취업통계 데이터
1. 데이터 형태
2. 데이터 분석
제3절 통계청 전국 사업체 조사 데이터
1. 데이터 형태
2. 데이터 분석

제5장 계열별 산업수요예측 모델 구축

제1절 계열별 산업수요예측 모델 개요
제2절 계열별 산업수요예측 모델
제3절 계열별 산업수요예측 모델 산출결과
1. 원 산업수요 예측 지수(Idxorg)
2. 중계열별 산업 수요 예측지수(Idx)
3. 계열별 산업 수요 예측 분석 시스템 프로토타입

제6장 결론 및 제언

제1절 결 론
제2절 제 언

참고문헌 158


[부록] 중계열-중분류간 산업수요 예측치 매트릭스
목록으로
메일로 보내기


제4유형
본 저작물은 "공공누리" 제4유형:출처표시+상업적 이용금지+변경금지 조건에 따라 이용 할 수 있습니다.



(27872)충청북도 진천군 덕산읍 정통로 18 정보통신정책연구원 전화안내 043)531-4114

copyright © Korea Information Society Development Institute ALL RIGHTS RESERVED.

KISDI QR코드 : 모바일 웹사이트 바로가기

<p><a href="http://www.kisdi.re.kr/kisdi/err/error.jsp" >프린트 프레임이 없습니다.</a></p>