대메뉴로 바로가기 서브메뉴 바로가기 컨텐츠 바로가기

통합검색

추천검색어
SNS, ott, 5G,


home > KISDI 발간물 > 연구보고서 > 정책연구
확대 축소 프린트

정책연구

정부의 장·단기 정책 발굴 및 대안수립을 위한 연구 및 민간기관·단체 등으로 부터 위탁받아 수행한 연구 보고서입니다.

태그 ICT ,빅데이터 ,이슈 탐색 ,수출예측 ,교육수요

  • 트위터 보내기
  • 페이스북 보내기
  • 미투데이 보내기
  • 네이버 보내기
  • 구글 보내기
  • 메일 보내기
텍스트자료를 활용한 ICT 이슈 탐지 및 분석 방법론 연구
제목 텍스트자료를 활용한 ICT 이슈 탐지 및 분석 방법론 연구
저자 심동녘 ·정용찬· 노희윤· 이선희 조회 2300
게재지 정책연구 권호 정책연구 20-04-02
언어 KOR 페이지 1-107 (총 107 pages)
PDF pdf열기텍스트자료를 활용한 ICT 이슈 탐지 및 분석 방법론 연구 발행일 2020.02.28
분류정보 IT산업 > IT산업/시장
전통적인 계량경제 분석은 자료 구축에 많은 시간이 소요되며 가용 가능한 자료의 형태가 제한적이므로 빅데이터 환경에서 양산되는 다양한 비정형 자료의 활용이 주목받고 있다. 특히 4차 산업혁명의 도래와 함께 ICT 분야에서 증거 기반 정책수립과 미래 예견적 정책기획의 중요성 증대되면서 ICT 전문잡지, 뉴스, 전문지 등 텍스트 자료를 활용하여 ICT분야 경제 이슈를 조기에 탐지하고 분석하는 방법론의 개발이 연구자들의 주목을 끌고 있다.
이에 본 연구에서는 비정형데이터 중 텍스트자료를 활용한 ICT이슈 탐지 및 분석 방안을 제안하고 적용하는 연구를 수행한다. 세부적으로 국내 정보통신 유관기관이 발행하는 전문지, 간행물 등 ICT정책 관련 전문자료를 텍스트마이닝 분석하여 정보통신 이슈탐색 및 분석의 가능성을 확인한다. 이후 분석대상 자료를 확장하여 <미·중 분쟁과 정보통신 기술·시장·산업 관련 담론 분석>을 수행한다. 지난 2018년 3월 미·중 무역분쟁이 촉발된 이후 약 16개월 이상 동안 다양한 이슈들이 등장하면서 실물 경제에 영향력을 행사하였다는 점을 고려하여, 미·중 무역분쟁 촉발 및 심화 국면에서 해당기간의 텍스트자료를 활용하여 회고적으로 분석하고자 한다.
이론 및 사례분석 결과, 웹 상에 존재하는 방대한 자료의 수집 및 저장이 용이해지고 대용량 자료에 대한 다양한 분석 기법들이 개발되면서, 대용량 자료 분석을 통해 다양한 분야에서 유의미한 함의를 도출해내기 위한 시도가 계속해서 이루어지고 있음을 알 수 있었다. 이 중 ICT 분야 등 기술 분야에 대한 이슈 분석은 지금까지 주로 특허 자료나 학술지 자료 등을 기반으로 이루어져 왔다. 그러나 이러한 자료는 자료가 산출되기까지 상당한 시간이 소요된다는 문제가 있다. 예를 들어, 특허는 기술 개발이 완료된 실용화/상용화 단계에서 출원·등록 하는 것이고, 학술지 역시 연구를 수행하고 논문을 작성한 후 심사를 거쳐 등재되는 것이기에 자료 산출까지 많은 시간이 소요된다. 따라서 이러한 자료를 이용한 분석은 특정 분야의 유망기술 이슈 탐색과 같이 자료의 적시성이 요구되는 분석에서는 성능이 제한될 수밖에 없다.
따라서 본 연구는 ICT 이슈분석을 위한 데이터로서 ITFIND 포털 내에 존재하는 분석 보고서 자료를 활용하기로 하였다. ITFIND는 국내외 IT산업 전반에 대한 정보를 수집하여 데이터베이스화한 곳으로, 주로 ICT 유관기관의 보고서와 같은 비정형 데이터를 수집하여 제공하고 있다(itfind.or.kr). 국내 ICT 유관기관의 보고서는 각 분야별로 최신 기술 동향을 분석하여 작성되고 있기에, ICT 이슈분석을 위한 적시성 측면에서 특허나 학술지보다 더 적절하다고 할 수 있다.
ICT 이슈분석을 위한 데이터로서 텍스트자료의 활용 가능성을 평가하기 위하여 ITFIND 내에 있는 분석 보고서의 텍스트자료를 수집하여 분석하였다. 구체적으로는 크게 세 종류의 텍스트마이닝 분석이 이루어졌다. 첫 번째는 단어 빈도에 기반한 기초 분석이다. 두 번째는 한 문서 내 단어들의 동시출현 맥락을 고려한 네트워크 분석이다. 마지막으로 세 번째는 문서 내에 잠재되어 있는 맥락적 토픽(주제)을 도출해내는 토픽모형을 이용한 심층적 분석이다.
이후 미·중 무역분쟁의 심화에 따른 국내 ICT산업의 영향을 미국과 중국을 중심으로 한 주요 외신의 텍스트자료를 활용하여 회고적으로 분석하였다. 미국과 중국의 대표적인 매체를 분석한 결과, 2018년 4월부터 미국과 중국 양국의 매체에서 갈등의 타겟과 조짐, 갈등 누적 과정, 핵심 이해관계, 국가적 충돌을 수반하는 행위의 정당화 기제 등을 데이터 트렌드 분석을 통해 조기 감지할 수 있었다. 일례로, 미·중 무역 갈등을 가시화시킨 촉매로 작용한 ‘화웨이(Huawei)’ 사태(멍완저우 부회장의 체포, 미국 금수 조치)는 갑자기 발생한 우발적 사건이 아님을 분석 결과를 통해 확인할 수 있다.
미국의 경우, 러시아 정치 스캔들과 Cambridge Analytica의 페이스북 사용자 정보 유출 등으로 인해 ‘정보보안’ 및 ‘안보’에 민감해진 사회 분위기를 배경으로 미·중 갈등의 본질을 기술을 매개로 한 안보문제로 프레임화 한 것으로 볼 수 있다. 이에 비해 중국의 매체에서는 화웨이 사태를 미국 및 트럼프와의 무역 갈등으로 인한 것으로 미국보다는 단순화하여 파악하고 있음을 확인할 수 있었다. 특히 국가 간 충돌을 수반하는 갈등과 이벤트의 경우 정당성 축적을 위한 담론이 언론 매체를 통해 지속적으로 전파된다는 사실은 본 분석을 통해 확인하였다.
미·중 통상마찰의 격화에 따른 국내 ICT산업 이슈와 관련하여 미국 뉴스 매체에서 유일하게 상위 리스트에 언급되는 한국기업은 ‘삼성’으로, 중국 기업의 안보 위협과 관련하여 삼성이 반복적으로 동시에 언급되는 패턴을 확인할 수 있었다. 중국 뉴스 매체에서 다루는 삼성은 화웨이 등 주요 중국 ICT기업들의 기술적 경쟁 상대로 언급되며, 자국내 법률 위반 등 사법적 처리 상황이 중국 언론에서 주된 관심의 대상으로 묘사되고 있음을 알 수 있다. 한편, 중국 뉴스 매체에서 등장한 상위리스트의 대부분이 기술 중심 산업과 관련된 키워드로 나타나기 시작했다는 사실을 주목할 필요가 있다. TF-IDF 상위리스트 분석을 통해 모바일, 자율주행, 스마트시티, (네트워크)장비, 얼굴 인식, 핀테크, 클라우드 등 4차 산업혁명과 관련한 다양한 기술에 대한 관심의 변동 추이를 확인할 수 있다. 특히, Hikvision, Lazada, Didi, Bytedance 등 중국 및 동남아권에서 주목받는 신생 테크기업들의 부상과 성장세를 데이터 모니터링을 통해 확인할 수 있었으며, 중국기업의 동남아 시장으로의 판로개척 본사이전, 동남아권 기업과의 M&A 등 다양한 방식의 對동남아 전략을 생각해 볼 수 있었다.
본 연구는 ICT 유관기관의 간행물, 보고서, 메거진 등을 텍스트마이닝 분석함으로서 최신 ICT이슈의 탐색 및 이슈분석 가능성을 확인하였다. 한편, 최근 국내 대외경제 불확실성을 가중시킨 주요 글로벌 이슈 중 하나인 미·중 무역분쟁 격화를 미·중 양국의 뉴스자료를 활용하여 각국의 이해관계를 통해 이슈를 해석하는 한편 국내 ICT산업에 영향을 미칠 수 있는 경로를 포착하였다.
본 연구의 수행과정에서 수행한 실증분석 또는 사례분석들을 시스템화 하여 주기적으로 수행함으로써 ICT 관련 국내외 주요 이슈를 비교적 실시간으로 추적할 수 있는가, 또는 이를 위한 기술적 요건은 무엇인지에 관하여 고민하였다. 이를 위한 전략은 다음과 같다. 첫째, 이슈탐지 목적 하에서 데이터를 보다 구조화 하는 과정이 필요하다. 단순한 빈도수가 아닌, TF-IDF 점수에 의거하여 키워드 상위 리스트를 도출하여 키워드-도큐먼트 패턴을 반영해야 한다. 나아가 상위 리스트에서 주기적으로 반복되는 키워드들을 과감하게 불용어로 처리하여 유의미하게 증가한 키워드를 포착할 수 있어야 한다. 또한 상위 리스트에 새롭게 등장한 키워드의 의미와 맥락을 파악할 수 있는 키워드 클러스터, 의미망을 구성할 수 있어야 한다. 둘째, 시각화 대상 선별 및 분석과정이 필요하다. 단어 빈도수 이외에 네트워크 중심성(betweenness, eigenvector, Bonacich Power) 등을 통해 키워드 영향력을 시각화 할 필요가 있다. 주목할 키워드가 속한 맥락을 파악하기 위한 정보의 시각화가 요긴하다. 이를 위해, 1) 원문 검색 2) 의미연결망 상의 연결어 3) 키워드의 통계물리학적 클러스터 등을 통해 숨겨진 함의를 유추할 수 있어야 한다.
제1장 서 론

제1절 연구의 배경 및 목적
1. 연구의 배경
2. 연구의 목적
제2절 연구의 범위 및 수행 방안
1. 연구의 범위
2. 연구 수행 방안

제2장 경제·사회 분석에서 텍스트자료 활용 사례

제1절 분야별·주제별 사례 분석
제2절 활용목적에 따른 빅데이터 분석 사례

제3장 이머징 이슈 탐색을 위한 텍스트 자료 분석 과정 탐색

제1절 논의 배경
제2절 이머징 이슈 분석을 위한 연구모형 및 연구사례
1. 이머징 이슈 탐색 연구모형
2. 이머징 이슈 탐색 연구사례
제3절 이머징 이슈 탐색 및 심층분석을 위한 텍스트마이닝 프로세스
1. 프로세스 설계 및 적용
2. 자료의 전처리
3. 이머징 이슈 분석과정 개요
4. 결론 및 제언

제4장 ICT 유관기관 간행물 텍스트마이닝 분석

제1절 ICT이슈분석을 위한 데이터로서 텍스트자료의 활용 가능성
제2절 텍스트마이닝 방법론을 적용한 ICT이슈분석
1. 분석 대상 자료 수집
2. 단어사전 성능 비교 및 단어사전 선정
3. 기초 분석
4. 공동출현 네트워크 분석
5. 토픽 모형 분석
6. 섹션별 주요 단어를 기반으로 한 토픽 주제 추론
제3절 텍스트마이닝 방법론을 적용한 ICT이슈분석 가능성

제5장 미·중 통상마찰의 전개과정과 ICT이슈 텍스트마이닝 분석

제1절 사례 개요
1. 사례의 선정
2. 미․중 무역분쟁 배경 및 경과
제2절 연구 방법 및 분석 프로세스
제3절 연구 결과
1. 기초분석
2. 미·중 갈등 외 ICT분야의 이슈 감지 결과

제6장 결 론

제1절 요약 및 결론
제2절 연구의 성과와 한계

참고문헌
목록으로
메일로 보내기


제4유형
본 저작물은 "공공누리" 제4유형:출처표시+상업적 이용금지+변경금지 조건에 따라 이용 할 수 있습니다.



(27872)충청북도 진천군 덕산읍 정통로 18 정보통신정책연구원 전화안내 043)531-4114

copyright &copy; Korea Information Society Development Institute ALL RIGHTS RESERVED.

KISDI QR코드 : 모바일 웹사이트 바로가기

<p><a href="http://www.kisdi.re.kr/kisdi/err/error.jsp" >프린트 프레임이 없습니다.</a></p>