[데이터로 보는 세상] 데이터과학 출현과 인공지능 발전의 끝은 어디인가

“데이터는 21세기의 원유이며, 데이터가 미래 경쟁우위를 좌우한다”라고 일찍이 지난 2011년 3월에 세계적인 시장조사 업체인 가트너(Gartner)는 강조했다. 이 말은 세월이 흐르면서 점점 더 진실임이 밝혀지고 있다.

우리는 지금 4차 산업혁명 시대에 살고 있으며, 그 주요 기술들인 빅데이터, 인공지능, 사물인터넷, 자율주행자동차 등이 모두 데이터 기반의 기술들이며, 데이터 강국이 4차 산업혁명에서 앞서가고 있다. 즉, 데이터가 국가든 기업이든 미래 경쟁력을 좌우하고 있다. 특히 데이터를 매개체로 비즈니스를 하는 데이터 플랫폼 기업들이 급성장하면서 우리 사회가 디지털 사회로 가고 있으며, 개인 정보는 물론 공공 부문이나 민간 부문에서 생산되는 모든 데이터의 수집, 관리, 활용 등이 매우 중요한 국가적 과제로 부상하고 있다.

실로 우리는 ‘데이터 경제(data economy)’ 시대에 살고 있다. ‘데이터 경제’란 개념은 유럽연합 집행위원회(EC)가 발표한 ‘유럽 데이터 경제 육성책(Building a European Data Economy, 2017)’에서 제시한 것으로, 데이터의 활용이 모든 산업의 발전과 새로운 가치 창출에 촉매 역할을 담당하는 시대의 경제라는 뜻이다. 이 육성책의 골자를 보면, 유럽연합 내에서 데이터의 자유로운 공개와 사용을 보장하고, 데이터 분석 역량을 강화해 새로운 비즈니스 모델을 발굴하는 데 각국이 역량을 강화하도록 권장하고 있다.

데이터 경제 시대와 디지털 플랫폼 정부

현재 전 세계적으로 디지털 전환에 관심이 높다. 윤석열 정부의 핵심 공약 중 하나는 ‘디지털 플랫폼 정부’로서, 방대한 데이터를 디지털화하여 효율적으로 국가 운영에 사용하면서 국가 경쟁력을 높이겠다는 것이다. 디지털 플랫폼 정부는 모든 데이터가 디지털로 연결되는 디지털 전환(DX)이 이뤄지고, 디지털 전환 위에 작성되는 디지털 플랫폼으로 국민, 기업, 정부가 함께 사회 문제를 해결하고, 최우선적으로 국민이 편하게 살아갈 수 있도록 새로운 가치를 창출하는 정부를 말한다.

이는 기존의 전산화된 정부를 뛰어 넘어 진정으로 디지털화된 정부, 칸막이를 없앤 정부, 그리고 디지털 시대에 걸맞는 업무 방식을 갖춘 정부를 말한다. 이런 정부가 되기 위해서는 국민과 정부가 모두 “DX의 가장 중요한 driver는 데이터이다”라는 개방된 생각을 가지고, 정부 정책 입안이나 실천에서 데이터 활용이 기초 사상이 되어야 한다. 또한 데이터를 중심으로 한 기업이나 비즈니스 모델에 보다 개방적이고 우호적이어야 한다.

데이터 경제 시대에는 데이터로부터 신속하고 정확하게 정보를 창출하고 활용하는 과학이 중요해지고 있다. 이런 학문을 데이터과학(data science) 혹은 데이터 사이언스라고 부른다.

데이터과학은 ‘박성현, 오진호, 권순선 (2016); 통계로 풀어가는 빅데이터, 한국표준협회미디어, 2016년 9월 1일 초판 발행’에서 밝힌 바와 같이, 데이터의 수집과 저장에 필요한 데이터 프로세싱 기술과 데이터 분석에 관한 지식(통계학, 데이터 마이닝, 기계학습 등)을 기반으로 다량의 데이터로부터 패턴을 찾아내고, 통계적 추정, 예측 모델링 등을 통하여 필요한 정보를 창출하고, 이를 실제로 활용하는 것을 연구하는 융합과학(con-vergence science)이다.

넓은 의미의 데이터과학은 <그림 1>에서 보는 바와 같이 데이터로부터 빅데이터와 AI 기술을 통하여 통찰력(insight) 있는 정보를 만들어 내는 21세기에 태어난 새로운 학문이다.

데이터과학의 밑바탕이 되는 기존의 학문은 수학, 통계학, 컴퓨터과학, 데이터 분석학(analytics), 데이터 시각화(data visualization), 비즈니스 인텔리전스(business intelligence) 등으로, 데이터과학은 명실공히 다학제간 연구 학문이다. 데이터과학은 빅데이터를 처리, 분석, 저장할 수 있도록 물리적 환경을 조성해 주는 데이터관리(data management) 분야와 데이터로부터 모델을 만들어 AI로 구현할 수 있도록 해주는 기계학습(machine learning) 분야로 나뉜다.

<그림 1>의 데이터과학의 체계도에서 모든 단계에서 사람이 개입하여 조절, 통제하는 인간과의 상호 작용(human interaction)이 역할을 하며, 이때 사용되는 기술로는 컴퓨터 비전, 자연어 처리(natural language processing), 음성인식(speech recognition), 로보틱스(robotics) 등이 활용된다. 데이터과학의 궁극적인 활용 범위는 다양한 산업에 적용(industrial applications)되어 새로운 제품 및 서비스를 창출함으로써 인간의 삶을 풍요롭게 해준다.

우리나라의 데이터과학과 AI 대학 교육 현황을 살펴보자. 우리나라는 2012년 3월 전국 최초로 미래창조과학부(현 과학기술정보통신부) 사업의 지원으로 충북대에 빅데이터 전문가 석사과정(계약학과의 형태)으로 비즈니스데이터융합학과를 개설했다. 그 후 2013년 국민대에 대학원 석사과정과 학부 과정의 데이터과학 교육이 시작되어 최근 많은 대학에서 데이터과학 학사, 석사, 박사과정을 운영하고 있다.

2020년 들어서면서 서울대에는 데이터사이언스대학원, 8개 대학(KAIST, 고려대, 성균관대, GIST, POSTECH, 연세대, 한양대, UNIST)에는 정부 지원으로 AI 대학원이 설립되었다. 이들 대학원에서는 데이터과학과 AI를 동시에 강의하고 있으며, 데이터·AI 전문가를 양성하고 있다. 이외에도 기존의 통계학과, 컴퓨터공학과, 정보과학과, 산업공학과, 경영학과 등에서도 데이터·AI 전문가 양성에 관심을 갖고 더 많은 교과과정 시간을 데이터과학이나 AI에 할애하고 있다.

2023년 6월 현재 우리나라에서 데이터과학과 AI 관련 학사, 석사, 박사학위 과정을 운영하고 있는 대학을 ’대입정보포털어디가(http://adiga.kr/)‘와 ’대학알리미
(https://www.academyinfo.go.kr/)’에서 정보를 취합하여 리스트하면 다음과 같다.

- 데이터과학 관련 학과 대학원 석/박사과정 개설: 총 19개 대학, 단, 8개 대학은 석사과정만 운영.
- 데이터과학 관련 학과 대학 학사과정 개설: 총 31개 대학
- AI 관련 학과 대학원 석/박사과정 개설: 총 91개 대학
단, 40개 대학은 석사과정만 운영.
- AI 관련 학과 대학 학사과정 개설: 총 148개 대학

따라서 최소 148개 대학에서 데이터과학이나 AI 학과를 운영하고 있다. 여기서 온라인이나 사이버 교육 프로그램은 제외하였다. 즉, 우리나라 대부분의 주요 대학에서 데이터과학이 AI를 교육하기 시작하고 있다. 많은 대학에서 데이터과학과 혹은 AI학과가 개설되어 있지만, 모든 대학생이 기초 교양 학문으로 데이터과학과 AI를 알고 있는 것은 아니다.

대학에서 인공지능과 데이터과학 교육이 더 심도 있게 확산되어야 한다. 대학 교육을 받은 21세기 지식인은 대학에서 전공에 불문하고 데이터과학 소양 교육을 받아야 한다고 생각한다. 왜냐하면 21세기는 ‘데이터·AI 경제 시대’이므로, 대학에서 ‘데이터과학 입문(혹은 빅데이터/인공지능 개론)’을 필수교양 과목으로 지정해야 한다.

데이터 마인드가 중요하다

4차 산업혁명은 데이터 기반의 지능 디지털 혁명이라고 흔히 부르고, 데이터가 매우 중요하다고 말한다. 그러면 ‘데이터’하면 무엇이 떠오를까? 많은 사람은 데이터는 내가 만들 수 있는 것이 아니고, 어떤 전문가들이 만들어 놓은 엄청난 숫자들의 조합, 그림, 표 등을 생각한다. 그러나 데이터는 보통 사람들도 주위에서 쉽게 만들 수 있는 것이며, 거기에서 가치를 찾을 수 있는 것이다. 세상을 데이터의 관점에서 바라보고, 이를 통해 세상의 흐름을 읽으려고 하는 ‘데이터 마인드(data mind)’가 필요하다. 데이터 마인드의 실천은 다음과 같은 과정을 거친다.

1) 자연이나 사회의 현상을 이해하기 위해서 관련된 데이터 수집 계획을 세우고 (plan),
2) 계획에 따라 데이터를 수집하여 정리하고 (do),
3) 데이터의 적절한 분석을 통하여 현상을 이해하고 (understand),
4) 자연이나 사회의 현상을 개선하려는 의지이다 (improve).

다시 말하면, 데이터 마인드는 데이터라는 렌즈를 통해 복잡한 현상에 대하여 객관적이고 바른 정확한 지식을 얻고, 이를 바탕으로 주어진 문제를 해결하려는 사고방식이다. 이런 마인드를 가지는 것은 데이터 기반의 4차 산업혁명 시대에 잘 적응하기 위한 매우 중요한 삶의 자세라고 하겠다.

19세기 유럽 전역을 공포에 떨게 했던 콜레라의 원인이 밝혀진 것은 데이터 마인드가 투철했던 존 스노우(John Snow, 1813∼1858))라는 의사에 의해서 이뤄졌다. 스노우는 런던에 콜레라가 유행하던 1853∼1854년에 콜레라 사망자의 발생 장소를 지도상에 <그림 2>와 같이 표시하였다.

스노우가 만든 지도에는 검은색 막대가 사망자 수를 표시하고, 검은색 막대는 브로드 스트리드(Broad Street)에 집중되어 있는 것을 발견하였다. 브로드 스트리트에 살고 있는 사람들은 모두 한 우물의 물을 먹는다는 사실에 착안하여 이 우물을 조사한 결과, 이 우물이 오물로 오염되어 있었고, 콜레라에 걸리는 원인을 제공한 것이었다. 이 발견 이후 스노우의 주장으로 이 우물은 폐쇄되었고, 더 이상의 콜레라 감염 확산을 막을 수 있었다.

이러한 업적 등으로 스노우를 역학(疫學)의 아버지라고 불리고 있다. 스노우의 조사는 데이터 마인드를 그대로 따른 좋은 사례라고 말할 수 있다. 그는 콜레라 발생 환자를 지역별로 조사해볼 계획(plan)을 세우고, 계획에 따라 데이터를 수집하여 지도에 그려 봤고(do), 그림으로부터 콜레라 환자 집중 발생 지역을 알아냈으며(understand), 그리고 원인을 제공한 우물을 폐쇄하여 콜레라 환자의 발생을 막는(improve) 활동을 한 것이다. 지금도 우리 주위에는 이러한 데이터 수집 및 분석이 가능한 경우가 수없이 많으며, 데이터 마인드를 가지면 데이터와 친해질 수 있다고 말할 수 있을 것이다.

AI의 발전

4차 산업혁명 기술 중에서 우리 사회에 가장 심대한 영향을 주는 기술은 인공지능(AI)이다. 컴퓨터 정보용어대사전에 따르면 인공지능이란 ’인간의 인식, 판단, 추론, 문제 해결, 그 결과로서의 언어나 행동 지령, 더 나아가서는 학습 기능과 같은 인간의 두뇌 작용을 이해하는 것을 연구 대상으로 하는 학문 분야‘이다. 궁극적으로는 두뇌의 기능을 기계로 실현하는 것을 목적으로 한다.

AI의 아버지라고 불리는 영국의 수학자 튜링(Alan Mathison Turing, 1912∼1954)은 ‘계산 기계와 지능’(Turing, A.M. (1950); Computing machinery and intelligence, Mind 49, No. 236, p.433-460, Oxford University Press.)이라는 논문에서, 기계가 생각할 수 있는지 테스트하는 방법(튜링 테스트(Turing test)), 지능적 기계의 개발 가능성, 학습하는 기계 등에 대해 그의 의견을 피력하였는데, 이것이 AI에 관한 최초의 연구였다.

컴퓨터 성능의 한계로 인하여 AI 연구는 1980년대 중반까지 별로 진전이 없었다. 그러나 1980년대 후반부터 컴퓨터의 성능이 좋아지고, 다양한 데이터들을 축적하고 축적된 데이터를 빠른 속도로 분석해 주는 논리 알고리즘이 개발되면서 AI 연구는 다시 중흥기를 맞이하게 되었다. 이때 인공신경망(neural network) 기술이 발전되면서, 경험을 통해서 배우고 사례들로부터 자연스러운 일반화 방식을 찾아냈으며, 숨은 통계적 패턴을 발견하게 되었다.

1990년대 중반부터는 AI 연구가 통계 기반 기계학습(machine learning)이 도입되면서 급진전이 이뤄졌다. 1997년에는 IBM의 인공지능 슈퍼컴퓨터 딥블루(Deep Blue)가 세계 체스 챔피언에게 승리했고, 1998년에는 소니 최초의 AI 로봇 애완동물 아이보(Aibo)가 개발됐다. 2010년대부터는 딥러닝(deep learning) 기법이 도입되면서 AI의 획기적이 발전이 이뤄지기 시작했다.

2011년에는 IBM이 개발한 슈퍼컴퓨터 왓슨(Watson)이 미국의 유명한 퀴즈쇼 ‘제퍼디(Jeopardy)’에서 우승하는 사건이 발생하였고, 또한 애플 인공지능 음성인식 소프트웨어 시리(Siri)가 발표되었다. 2014년에는 Facebook에서 얼굴인식 기술인 딥페이스(DeepFace)를 공개하여 세상을 놀라게 한 바 있다.

2015년에는 구글이 인수한 딥마인드(Google DeepMind) 벤처기업이 개발한 AI 바둑 프로그램인 알파고(AlphaGo)가 처음으로 소개되었고, 2016년에는 한국의 이세돌 9단과의 공개 대국에서 4승 1패로 승리했다. 또한 2017년에는 바둑 세계 랭킹 1위 프로기사인 중국의 커제 9단과의 3번기에서 모두 승리함으로써, AI 바둑 프로그램이 이미 인간을 넘어섰음을 증명하였다.

알파고의 핵심 알고리즘은 딥러닝 기술이라고 볼 수 있다. 딥러닝은 빅데이터와 컴퓨터 알고리즘의 협업의 뛰어난 산물이다. 이 기술로 수십만 건의 빅데이터 기보(棋譜) 학습을 통하여 인간과 거의 비슷한 방식으로 학습하여 기억하고 판단하는 고안된 컴퓨터 프로그램이 알파고(AlphaGo)이다.

과거 영국을 중심으로 시작된 산업혁명이 사회를 바꿔 놓은 것처럼, AI가 산업혁명에 버금가는 사회 변화를 초래할 것으로 예상된다. AI의 대표적인 제품이 챗GPT(ChatGPT)이다. 챗GPT는 Chat(대화형)과 Generative Pre-trained Transformer (GPT, 생성형 사전 학습 변환기)의 합성어이다.

챗GPT는 2022년 11월 30일 미국 샌프란시스코에 있는 OpenAI라는 회사가 출시(GPT-3.5)한 AI 챗봇(ChatBot, 대화형 AI)으로, 두 달 후인 2023년 1월 말 전 세계 사용자 수가 1억 명을 돌파하는 등 선풍적인 인기를 차지하고 있는 소비자 애플리케이션이다. 챗GPT는 다양한 지식 분야에서 상세한 응답과 정교한 답변으로 집중 조명을 받고 있다. 다만, 정보의 정확도에는 아직 중요한 결점이 지적되고는 있다.

챗GPT가 촉발한 생성형 AI 기술 경쟁이 글로벌 빅테크(대형 기술 기업) 지도를 바꾸고 있다. AI 기술이 일상생활을 바꾸는 ‘게임체인저(game changer)’의 역할을 하기 시작하면서 경쟁력을 갖춘 기업과 그렇지 못한 기업의 격차가 벌어지고 있기 때문이다. OpenAI는 2022년 말 GPT-3.5를 업그레이드하여 GPT-4를 공개하고 선풍적인 인기를 독차지하고 있다. OpenAI의 파트너사인 마이크로소프트(MS)는 OpenAI의 회사 지분 49%를 보유하고 있으면서 챗GPT를 MS의 검색 엔진 빙(Bing)에 탑재하고, 웹브라우저 에지를 공개하면서 AI 경쟁의 선두로 부상하고 있다.

AI의 선두 주자였던 구글은 AI 개발조직 ‘구글 딥마인드’를 새롭게 꾸리고 챗봇 바드(Bard)를 공개하는 등 MS와 OpenAI를 추격하고 있다. 애플도 뒤늦게 생성형 AI 개발에 뛰어들었다. 애플은 자체 프레임워크 ‘에이잭스(Ajax)’를 기반으로 챗봇 서비스를 만드는 새로운 전략을 발표하고 이를 ‘애플 GPT’라고 부른다. 앞으로 생성형 AI 시장을 둘러싼 경쟁을 치열해질 전망이다. OpenAI와 MS가 선두 주자이지만 구글, 애플, 아마존, 메타 등의 추격도 만만치 않다.

AI 분야에서 미국이 앞서가고 있지만 미국을 바짝 쫓고 있는 국가는 중국이다. 중국 최대 포털기업인 바이두는 자사의 생성형 AI인 ‘어니봇’을 출시했다. 중국에서는 바이두를 선두로 알리바바, 센스타임, 텐센트, 바이트댄스 등이 챗GPT 대항마 개발에 뛰어들고 있다. 한국에서도 많은 IT 관련 기업이 챗GPT 개발에 관심을 가지고 있다. 삼성전자, LG, 네이버, 카카오, SKT, KT 국내 주요 대기업들도 모두 자체 초거대 AI 개발에 뛰어든 상황이다. 어느 기업의 챗봇이 소비자의 사랑을 받을지 지켜봐야 할 것이다.

AI 로봇이 인간을 초월하는 특이점이 올까

미래학자이자 구글의 엔지니어링 이사인 커즈와일(Ray Kuzweil)은 2005년 출간된 그의 베스트셀러 저서 ‘특이점이 온다 - 기술이 인간을 초월하는 순간’에서 다음과 같이 주장했다. “생물학적 인체는 유지·관리하기 까다로울 뿐더러 허약하고 기능에 문제가 생기기 쉽다. 인간의 지능은 가끔 창조성과 의미 표현에서 뛰어난 면을 드러내기도 하지만, 대부분 독창적이지 못해서 보잘 것 없고 제한적이다. 특이점을 통해 우리는 생물학적 몸과 뇌의 한계를 극복할 수 있을 것이다.”

특이점(singularity)이란 기계의 지능이 자신의 창조자인 인간의 지능을 넘어서고, 생물학적인 생명이 기술의 하위 범주가 되는 시기를 말한다. 따라서 특이점이 오면 인간이 만든 인공지능 로봇이 인간을 지배할 수도 있는 것이다. 커즈와일은 현재의 기술 발전 속도라면 특이점이 2045년경에 찾아올 것으로 예측했다.

인공지능과 뇌과학 및 생체과학의 급속한 발달을 보면 특이점이 올지도 모르겠다는 생각이 들기도 하지만, 인체의 오묘한 사고방식, 마음과 정서, 감정, 사랑 등의 섬세함을 기계가 온전히 대체하기 어려울 것이란 판단도 든다.

인간의 감각, 지능, 수명 같은 인간의 생물학적 한계를 넘어서려는 과학기술 운동을 트랜스휴머니즘(transhumanism)이라고 부르며, 이 운동에서도 커즈와일과 같은 생각을 하고 있다. 이 운동의 지지자들은 장애, 고통, 질병, 노화, 죽음 같은 인간의 타고난 한계를 인정하지 않고, 인지 증강, 스마트 약물, 유전자 선택, 뇌 임플란트 등으로 신체적 능력을 물론 지능까지도 획기적으로 개선할 수 있다고 믿는다.

트랜스휴머니스트들은 궁극적으로 사람의 뇌를 스캔해 외부 기계장치로 옮기는 ‘마음 업로드(mind upload)’를 통해 늙지도 죽지도 않는 새로운 몸으로 살 수 있다고 주장한다. 미국 애리조나주 스코츠데일(Scottsdale)에 있는 알코어생명연장재단은 세계 최대의 인체 냉동보존 시설이다. 사람이 죽으면 시신을 액체질소에서 보존하다 기술이 발전했을 때 녹여 되살리는 계획을 가지고 있다. 알코어에 보존 중인 사람은 117명이며, 죽은 후에 20만 달러를 내고, 여기에 오겠다고 계약한 사람도 수백 명이 넘는다고 한다.

<그림 3>은 특이점이 오는 시점을 보여주고 있다. 기계 지능이 발전하여 인간지능을 넘는 시점인 2045년 전후를 보여주고 있다. 트랜스휴머니스트들은 이런 시점이 올 것으로 믿고 있는 사람들이다. 이들의 주장대로 특이점이 과연 올 것이며, 인간이 냉동보존되었다고 다시 살아나는 것과 같이 영생불사하는 것이 가능할까? 두고 볼 일이다.

본 기사는 시사주간지 <미래한국>의 고유 콘텐츠입니다.
외부게재시 개인은 출처와 링크를 밝혀주시고, 언론사는 전문게재의 경우 본사와 협의 바랍니다.

트윗하기