4차 산업혁명이 화두다. 4차 산업혁명은 초연결, 초지능이라는 키워드를 바탕으로 새로운 세상을 열 것으로 논의되고 있다. 이에 따라 일자리에도 큰 변화가 예고된다. 다수의 학자들은 인공지능 기술로 무장한 로봇과 기계화가 가져올 자동화로 인해 기존의 많은 일자리는 사라지고 새로운 일자리가 만들어질 것이라고 경고하고 있다.
이런 맥락에서 자료를 수집하고 분석하여 결과를 제시하는 통계학자는 빅데이터로 저장된 데이터와 진화하는 인공지능 사이에서 설 자리를 잃은 것 같기도 하다. 하지만 숫자로 표현되는 인간의 행동을 잘 살펴보면 인간의 두뇌가 그리 단순하지만은 않다는 것을 새삼 깨닫게 된다. 인간의 흔적에 대한 숫자를 대하는 것은 그리 기계적인 관점만으로 접근해서 될 만한 일은 아니다.
빅데이터 분석의 핵심은 다수의 관측치를 바탕으로 특정한 패턴을 인식하는데 있다. 다시 말하면 반복적인 현상을 알아채고, 더 나아가서는 비슷한 일이 발생했을 때 일어날 결과를 미리 예측하는 것이다. 하지만 이것이 말처럼 쉬운 일은 아니다. 방대한 자료에서 신호(signal)와 소음(noise)을 구분해 내는 것, 그리고 반복적으로 관측되는 특정 패턴에 대해 이해하는 것, 둘 다 복잡하고 어려운 일이다.
반세기도 더 오래전에 영국의 통계학자 에드워드 심슨은 조건부 확률의 역설에 대해 논한 적이 있다. 어떠한 사건이 일어날 확률이 특정 조건을 내세우게 되면 그 결과가 뒤바뀔 수 있는 현상을 그의 이름을 따라 ‘심슨의 역설(Simpson’s Paradox)‘이라고 이야기 하는데, 가장 유명한 사례 중 하나는 한 미국의 명문대 대학원의 합격률 자료이다. 최종 입학심사 결과자료를 보면, 남학생의 합격률이 여학생의 합격률보다 높아 마치 성차별이 이루어진 것처럼 보이지만, 속을 들여다보면 전혀 다른 결과가 나온다. 바로 ‘조건’을 내세워 보는 것이다. 각 ‘학과별’ 합격률을 보면 결과는 다르게 나타났는데, 사실 여학생의 합격률이 높은 학과가 남학생의 합격률이 높은 학과보다 많았던 것이다.
때때로 빅데이터로 모아진 방대한 자료는 심슨의 역설(Simpson’s Paradox)로 돌아오기도 하고, 다양한 변수들의 관계를 분석하다 보면 인과관계로는 설명이 부족한 상관관계의 깊은 늪에 빠져버리기도 한다. 이러한 통계 수치들은 “왜?”라는 질문에 스스로 대답을 해 주지는 않는다. 문제를 제기하고 그 해결과정을 찾아내고, 결과를 해석하는 것을 기계가 대체해 주진 않을 것이지만, 호기심으로 가득한 눈으로 우리의 일상을 관찰하는 것을 시작으로 사고가 확장될 때 가능할 것이다.
숫자가 하는 말을 가만히 들여다보고 경청할 수 있는 능력은 인문학적 소양이 바탕이 되었을 때 그 가치를 발휘한다. 4차 산업혁명이 몰고 올 시대에 필요한 인재상은 이미 발전된 기술을 얼마나 더 발전시킬 수 있느냐에 국한되어 있지만은 않은 것 같다. 기존의 틀을 벗어나는 사고를 할 수 있는 창의성, 인간의 가치와 행동에 대한 이해를 바탕으로 수치를 재해석 할 수 있는 통찰력이 필요한 시대이다.