대메뉴로 바로가기 서브메뉴 바로가기 컨텐츠 바로가기

통합검색

추천검색어
SNS, ott, 5G,


home > KISDI 발간물 > 연구보고서 > 정책연구
확대 축소 프린트

정책연구

정부의 장·단기 정책 발굴 및 대안수립을 위한 연구 및 민간기관·단체 등으로 부터 위탁받아 수행한 연구 보고서입니다.

태그 ICT ,빅데이터 ,이슈 탐색 ,수출예측 ,교육수요

  • 트위터 보내기
  • 페이스북 보내기
  • 미투데이 보내기
  • 네이버 보내기
  • 구글 보내기
  • 메일 보내기
ICT정책 지원을 위한 빅데이터 분석 및 예측모형 개발
제목 ICT정책 지원을 위한 빅데이터 분석 및 예측모형 개발
저자 정용찬 ·고동환· 심동녘· 유선실· 정부연· 이선희· 노희윤· 윤건 조회 2647
게재지 정책연구 권호 정책연구 20-04-01
언어 KOR 페이지 1-191 (총 191 pages)
PDF pdf열기ICT정책 지원을 위한 빅데이터 분석 및 예측모형 개발 발행일 2020.02.28
분류정보 IT산업 > IT산업/시장
본 연구는 정형자료(경제·사회 조사자료)와 비정형자료(언론, 신문기사, 포털 검색 등)의 결합을 통한 통합 분석 모형 개발을 목적으로 세 개의 독립된 연구 과제로 구성하였다. 첫 번째 연구과제인 텍스트자료를 활용한 ICT 이슈 탐지 및 분석 방법론 연구는 경제·사회 분석에서 텍스트자료 활용사례와 이머징 이슈탐색을 위해 토픽모델링 알고리즘을 포함하여 최신 이론모형을 검토하였다. 실증분석에서는 텍스트마이닝의 주요 절차와 이론모형들을 토대로 ICT 유관기관의 간행물, 보고서, 메거진 등을 텍스트마이닝 분석함으로서 최신 ICT이슈의 탐색 및 이슈분석 가능성을 확인하였다. 또한 최근 국내 대외경제 불확실성을 가중시킨 주요 글로벌 이슈중 하나인 미·중 무역분쟁 격화를 미국과 중국 양국의 뉴스자료를 활용하여 각국의 이해관계를 통해 이슈를 해석하는 한편 국내 ICT 산업에 영향을 미칠 수 있는 경로를 포착하였다.
두 번째 연구과제인 정형·비정형 데이터 기반 ICT 수출 예측 방법론 개발 연구는 비정형 데이터인 온라인 뉴스 기사를 분석하여 반도체 수출과 관련된 지수를 산출하고, 이를 정형 데이터(주로 거시변수)와 결합하여 최적의 예측 모형을 개발하였다. 정형 데이터로는 GDP, 생산자 물가지수, 투자 등과 같은 거시적 변수들을 사용하며 이를 온라인 뉴스 기사로부터 산출한 일종의 경기실사지수(BSI)와 결합하며, 속성이 서로 다른 두 종류의 데이터의 결합으로 인한 과다한 모수 추정 문제를 해결하기 위해 베이지안 방법을 활용한 DMA(Dynamic Model Averaging), DMS(Dynamic Model Selection)를 이용하여 예측 모형을 구축하였다.
세 번째 연구과제인 인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발 연구는 주요국의 고등교육정책 결정시 빅데이터 활용 사례와 관련 연구를 분석하고 입력 데이터로 교육 분야에서는 KEDI의 교육기본통계 정보, 한국대학교육협의회의 대학정보공시 정보와 대학 학생수, 정원 데이터를, 산업 분야에서는 한국고용정보원의 미래 직업 전망 데이터, 통계청의 산업별 인력 수요 데이터를 분석하여 예측모형에의 활용 가능성을 검토하였다. 최종 선정된 데이터 셋을 AI 분석 알고리즘에 적용시키기 위해 전처리 과정을 거쳐 분석용 데이터로 전환한 후 머신러닝 알고리즘을 적용하여 계열별 산업수요 예측 모델을 선정하고 모델 적합성을 점검하였다.
본 연구는 정보통신정책연구원이 과제 총괄을 맡아 개념화, 이론 검토와 재구성, 실태진단과 주요 이슈를 도출하고, 세부 연구 과제별 이론 검토와 함께 최적의 모형 개발을 위해 협동 연구진과 공동연구를 추진하였다. 세부 연구주제를 가장 잘 수행할 수 있는 전문성을 갖춘 한국통계학회와 교육개발원을 선정하여 공동연구를 수행하였다.
연구의 전문성 확보와 정책적 기여도 제고를 위해 산·학·연 전문가 초청강연 및 방법론 세미나를 수행하였다. 텍스트분석 전문가를 초빙하여 크롤링, 토픽모델링, 머신러닝, 파이선 등의 교육과 실습을 수행하였으며, 관련 학자는 물론 ICT 및 반도체 분야 전문가와 현업 전문가로 자문단을 구성하여 연구 진행 단계별로 인터뷰, 연구협력회의, 자문 등의 방법을 활용하였다.
제1장 서 론

제1절 연구 배경과 목적
1. 연구 배경
2. 연구 목적
제2절 연구 내용과 추진체계
1. 연구 내용
2. 연구 추진체계

제2장 데이터 기반 정책 연구 동향과 주요국 사례 분석

제1절 데이터 기반 정책 연구 동향
1. 데이터·증거기반정책에 대한 본질적 논의
2. 데이터·증거기반정책에 대한 역사적 접근
3. 데이터·증거기반정책의 결과에 관한 연구
4. 데이터·증거기반정책의 영향요인
제2절 주요국의 데이터 기반 정책 벤치마킹
1. 미국의 증거기반정책법
2. 영국 ADR UK

제3장 텍스트자료를 활용한 ICT이슈 탐지 및 분석 방법론 연구

제1절 연구의 배경 및 목적
1. 연구의 배경
2. 연구의 목적
3. 연구의 범위 및 수행 방안
제2절 ICT정책이슈 텍스트마이닝 분석
1. 문제 제기
2. 분석 대상 자료 수집 및 전처리
3. 기초 분석
4. 공동출현 네트워크 분석
5. 토픽 모형 분석
6. 섹션별 주요 단어를 기반으로 한 토픽 주제 추론
7. 요약 및 시사점
제3절 미․중 통상마찰의 전개과정과 ICT이슈 텍스트마이닝 분석
1. 미․중 통상마찰 개요
2. 분석 프로세스
3. 기초분석
4. 토픽모델링 분석
5. 미·중 갈등관련 국내외 ICT 이머징 이슈 탐색
제4절 결론 및 시사점
1. 분석결과 요약
2. 연구의 성과
3. 연구의 한계

제4장 정형·비정형 데이터 기반 ICT수출 예측 방법론 개발

제1절 연구의 개요
1. 연구배경
2. 기존연구
3. 연구내용
제2절 온라인뉴스 지수화
1. 온라인뉴스 수집(크롤링, crawling)
2. 전처리(pre-processing) 및 단어 임베딩(embedding)
3. 분류모형
4. 온라인 뉴스 지수화
제3절 주제별 지수를 활용한 예측모형
1. 비추정(ratio estimation) 모형
2. 기계학습 분류 이용 예측
3. 어휘사전 분류 이용 예측결과
4. 결과 요약
제4절 ICT수출 전망 모형의 구축
1. 예측모형의 구축
2. 비정형 데이터와의 결합
3. 예측모형 추정과 예측결과
4. 비정형 데이터와 결합된 모형의 예측 결과
제5절 소결론
1. 연구 성과와 한계
2. 연구의의와 기대효과

제5장 인구지형변화에 따른 머신러닝 기반 고등교육 계열별 수요예측 모형 개발

제1절 연구의 필요성
제2절 연구의 목적
제3절 빅데이터와 AI를 활용한 데이터 분석 방법
1. 데이터 과학의 분석 단계
2. 데이터 분석 환경
3. 데이터 분석 알고리즘
제4절 선행 연구
1. 교육 분야의 빅데이터, AI 관련 연구
2. 대학정원 및 대학 학생 수급 관련 연구 현황
3. 주요 선행연구와의 차별화
제5절 고등교육기관 졸업자 취업통계 데이터
1. 데이터 형태
2. 데이터 분석
제6절 통계청 전국 사업체 조사 데이터
1. 데이터 형태
2. 데이터 분석
제7절 계열별 산업수요예측 모델
제8절 계열별 산업수요예측 모델 산출결과
1. 원 산업수요 예측 지수(Idxorg)
2. 중계열별 산업 수요 예측지수(Idx)
3. 계열별 산업 수요 예측 분석 시스템 프로토타입
제9절 정책적 제언

제6장 결 론

제1절 연구의 성과와 한계
제2절 연구의의와 기대효과

참고문헌
목록으로
메일로 보내기


제4유형
본 저작물은 "공공누리" 제4유형:출처표시+상업적 이용금지+변경금지 조건에 따라 이용 할 수 있습니다.



(27872)충청북도 진천군 덕산읍 정통로 18 정보통신정책연구원 전화안내 043)531-4114

copyright © Korea Information Society Development Institute ALL RIGHTS RESERVED.

KISDI QR코드 : 모바일 웹사이트 바로가기

<p><a href="http://www.kisdi.re.kr/kisdi/err/error.jsp" >프린트 프레임이 없습니다.</a></p>