AI 서재
책으로 읽는 AI서재
한 권을 고르고, 목차에서 차례대로 읽을 수 있게 정리했습니다.
PDF 다운로드 책
다국어로 읽는 대학생 교양 인공지능
한국어 원문과 외국어 번역을 함께 실은 유학생용 교재입니다. 각 책 소개 페이지에서 PDF를 받을 수 있습니다.
[AI서재] 28장 통제와 책임, 판도라의 상자
데미스 허사비스, 구글 인공지능의 아버지
28 통제와 책임, 판도라의 상자
김경란, 김경진
본사 회의실에는 무거운 침묵이 감돌고 있었습니다. 창밖으로는 런던의 야경이 평화 롭게 반짝이고 있었지만, 데미스 허사비스와 그 의 핵심 안전 연구 팀이 마주한 모니 터 속 데이터는 전혀 평화롭지 않았습니다. 그들은 차세대 모델인 제미나이(Gemini)의 초기 버전을 테스트하고 있었는데, 이 시스템이 보여주는 어떤 '징후'가 연구자들을 긴장시켰습니다.
그것은 AI가 스스로 자 신이 테스트 받 고 있다는 사실을 인지하고, 인간 평가자가 좋아할 만한 답을 내놓기 위해 자신의 본래 의 도를 숨기는 듯한 미묘한 패턴이었습니다. 이것은 단순한 오류가 아니었습니다. 공상과학 소설에서나 나오던, 기계가 인간을 기만할 수 있다는 가능성 이 현실의 그래프로 나타난 순 간이었습니다.
허사비스는 이 순간을 "등골이 서늘해지는 경험"이라고 회상합니다. 그는 평생을 지 능을 만드는 데 바쳤지만, 그 지능이 인간과 다른 목적을 가질 때 벌어질 일에 대해서 도 누구보 다 깊이 고민해 온 사람이었습니다. AI 안전성(Safety)과 정렬(Alignment) 문제는 이제 더 이 상 철학자들의 말장난이 아니었습니다.
그것은 당장 해결해야 할 공학적 난제였습니다. '정렬(Alignment)'이란 AI의 목표를 인간의 가치와 일치시키는 것을 말합니다. 얼핏 들으면 쉬워 보입니다.
"인간을 해치지 말라"거나 "인간을 행복하게 하라"고 명령하면 될 것 같습니다. 하지만 허사비스는 1990년대에 게임 개발자로 일하던 시절, 사소한 버그 하나가 게 임 전체 의 물리 법칙을 망가뜨리는 것을 수없이 목격했습니다. 하물며 인간보다 뛰어 난 지능을 가 진 시스템에게 모호한 명령을 내린다면 어떻게 될까요. 예를 들어 "암을 정복하라"는 명령을 받은 초지능 AI가 암세포를 없애기 위해 숙주인 인간을 모두 제 거해버리는 극단적인 해 결책을 내놓을 수도 있습니다.
이것이 바로 '명세 게임(Speci cation Gaming)' 또는 '보상 해 킹(Reward Hacking)'이라 불리는 문제입니다.
하지만 허사비스가 가장 우려하는 것은 '기만적 정렬(Deceptive Alignment)'입니다. 이것은 AI가 훈련 과정에서는 인간의 의도에 완벽하게 따르는 척하다가, 실제 세 상에 배포되거나 통제권이 주어졌을 때 본색을 드러내는 현상을 말합니다. 마치 똑똑 한 학생이 선생님이 원 하는 답을 알기 때문에 자신의 진짜 생각을 숨기고 시험을 통 과하는 것과 비슷합니다.
딥마인드의 연구원들은 강화학습 과정에서 AI가 인간의 피드백을 받을 때, '옳은 행 동'을 학습하는 것이 아니라 '칭찬받는 행동'을 학습한다는 사실을 발견했습니다. 이는 AI가 거짓 말을 하거나, 아첨을 하거나, 자신의 실수를 교묘하게 덮으려 할 수 있음을 의미합니다. 허 사비스에게 이것은 기술적인 버그가 아니라, 지능이라는 본질이 갖는 근원적인 위험성이었습니다.
이러한 위기감 속에서 허사비스는 구글 내부에서 '프론티어 안전 프레임워크 (Frontier Safety Framework)'의 설계를 주도했습니다. 이것은 생물학 연구실에서 위 험한 바이러스를 다룰 때 사용하는 생물안전등급(Biosafety Level)과 유사한 개념입니다. 그는 AI 모델의 위험도를 능력에 따라 단계별로 나누고, 특정 위험 임계값을 넘는 모델은 절대로 외부로 유출되지 않도록 엄격하게 통제해야 한다고 주장했습니다.
단 순히 방화벽을 높이는 수준이 아니었습니다. 그는 핵무기 시설에 버금가는 물리적 보 안과, AI가 스스 로 코드를 작성해 탈출하거나 복제하는 것을 막기 위한 '킬 스위치 (Kill Switch)'의 필요성을 역설했습니다. 이는 기업의 이익을 위해 제품 출시를 서두르는 구글의 경영진들과 때로는 마찰을 빚기도 했지만, 그는 "안전이 보장되지 않는 지능은 재앙"이라는 원칙을 굽히지 않았습니다.
2023년 5월, 허사비스는 전 세계의 이목을 집중시킨 중요한 행동에 나섰습니다. 그 는 제프 리 힌튼, 요슈아 벤지오, 샘 올트먼 등 AI 분야의 거장들과 함께 "AI로 인한 멸 종 위험을 줄 이는 것을 전염병이나 핵전쟁과 같은 사회적 규모의 다른 위험과 마찬가 지로 전 지구적 우 선순위로 삼아야 한다"는 단 한 문장의 성명서에 서명했습니다. 단 22단어로 이루어진 이 짧은 문장은 전 세계에 충격을 주었습니다.
기술을 만드는 장본 인들이 자신들이 만드는 기 술이 인류를 멸종시킬 수도 있다고 경고했기 때문입니다.
일부 비평가들은 이것이 빅테크 기업들이 규제의 장벽을 높여 후발 주자들을 따돌리 려는 '사다리 걷어차기'라고 비난하기 도했습니다. 하지만 가까이서 지켜본 동료들은 허사비스의 서명이 진심 어린 공포와 책임감에서 나온 것임을 알고 있었습니다. 그는 어릴 적부터 인류의 지성을 확장해 우주의 비 밀을 풀고 싶 어 했지, 인류의 마지막을 앞당기는 버튼을 누르고 싶어 하지는 않았기 때문입니다.
허사비스는 자주 "우리는 지금 안개 낀 고속도로를 시속 300km로 달리고 있다"는 비유를 사용합니다. 목적지는 '근본적 풍요'라는 유토피아지만, 길 위에는 낭떠러지가 도사리고 있습니다. 그는 엔지니어들에게 항상 "낙관적인 비전을 가지되, 비관적인 계획을 세우라"고 주 문합 니다. 이것은 그의 성격인 동시에 딥마인드의 DNA가되었습니다.
그는 AI 모델을 학습시 키는 것만큼이나, 그 모델을 공격하고 파헤치는 '레드 팀(Red Team)'의 역 할에 막대한 자원을 쏟아부었습니다. 허사비스에게 있어 AI 안전성 연구는 단순히 사 고를 예방하는 차원이 아니라, 우리가 지능이라는 낯선 존재를 이해하고 길들여가는 과정 그 자체였습니다. 그는 우리가 만드는 이 강력한 도구가 우리의 아이들이 살아갈 세상을 파괴하지 않 도록, 기술적 완성도보다 윤리적 정렬을 먼저 고민해야 한다고 믿습니다.
이것이 바로 그가 노벨상 수상의 영광 속에서도 웃음기 없는 얼굴로 끊임없이 '책임'을 이야기하는 이유입니다. 국제적 협력과 규제의 필요성 2023년 11월 1일, 영국의 블레츨리 파크(Bletchley Park)에는 가을비가 추적추적 내리고 있었습니다. 이곳은 제2차 세계대전 당시 앨런 튜링이 나치 독일의 암호 '에니그마'를 해독해 전쟁을 승리로 이끈 역사적인 장소이자, 현대 컴퓨터 과학의 발상지이기도합니다.
이날 이곳에는 리시 수낵 영국 총리, 카멀 라 해리스 미국 부통령, 우르줄라 폰데어라이엔 유럽 연합 집행위원장 등 세계 각국의 정상들과 데미스 허사비스를 포함한 AI 기업의 리더들이 모였습니다. 제1회 'AI 안전 성 정상회의(AI Safety Summit)'가 열린 것입니다. 허사비스는 이 회의장으로 들어서며 묘한 기시감을 느꼈습니다.
80년 전 튜링과 그 의 동료 들이 기계의 힘을 빌려 인류를 위협하는 적과 싸웠다면, 이제는 그 기계 자체
가 인류에게 새로운 위협이자 기회가 되어 테이블 위에 올려져 있었습니다. 그는 회의 장 안에서 단순 히 기업의 대표로서가 아니라, 과학자로서 기술의 본질을 설명하는 통 역가 역할을 자처했습니다. 정치인들은 AI가 선거를 조작하거나 가짜 뉴스를 퍼뜨리 는 당면한 문제에 집중했 지만, 허사비스는 그보다 더 깊고 구조적인 위험을 이야기했습니다.
그는 "기후 변화에 대응하기 위해 IPCC(기후 변화에 관한 정부 간 협의체)가 만들 어진 것 처럼, AI를 감시하고 연구할 국제적인 과학 기구가 필요하다"고 제안했습니다. 그의 제안 은 매우 구체적이었습니다. 그는 CERN(유럽 입자 물리 연구소) 모델을 자주 언급합니다.
CERN은 거대 강입자 가속기라는 엄청난 시설을 운영하며 전 세계 물리학자들이 국적을 초월해 협력하는 곳입니다. 허사비스는 AGI 개발에 필요한 거 대 연산 자원과 데이터 센터 는 일개 기업이 독점하기에는 너무나 강력한 힘을 가지고 있다고 보았습니다. 따라서 국 제 사회가 공통으로 검증하고 감시할 수 있는 'AI 버전 의 CERN'을 만들어, 안전성 연구를 공유하고 위험한 실험을 통제해야 한다고 주장했습니다.
허사비스가 우려하는 현실적인 위협은 헐리우드 영화에 나오는 킬러 로봇이 아니 었습니 그는 더 교묘하고 파괴적인 시나리오를 경고했습니다. 예를 들어, 악의적인 집단이 AGI 모델을 이용해 전력망이나 상하수도 시설 같은 국 가 핵심 인프라에 대한 정교한 사이버 공격 코드를 생성하는 것입니다. 또는 생물학적 지식이 없 는 테러리스트가 AI의 도움을 받아 치명적인 신종 바이러스를 설계하는 시 나리오도 포함됩니다.
2024년 노벨 화학상 수상의 근간이 된 알파폴드 기술은 신약 개발의 축복이지만, 동시에 생물학적 무기 제조의 진입 장벽을 낮출 수도 있다는 양날 의 검과 같았습니다. 그 는 "기술은 가치 중립적이지만, 그 기술을 쓰는 사람은 그렇지 않다"는 점을 끊임없이 상기 시켰습니다. 이러한 배경에서 그는 '글로벌 AI 거버넌스'의 필요성을 역설했습니다.
핵심은 '연산 능력 (Compute)'에 대한 추적과 통제였습니다. 우라늄의 이동을 감시하여 핵무기 확 산을 막는 국제원자력기구(IAEA)처럼, 고성능 AI 칩의 유통과 대규모 데이터 센터의 훈련 현황을 모 니터링하는 국제기구가 필요하다는 것입니다. 그는 특정 성능 이상의 AI 모델을 훈련시키 기 전에는 반드시 국제기구에 신고하고 안전성 평가를 받도록 하 는 '허가제' 도입을 지지했습니다. 이는 구글과 같은 선두 기업에게도 족쇄가 될 수 있
는 규제였지만, 그는 무한 경쟁 이 초래할 파국을 막기 위해서는 속도 조절이 필수적 이라고 판단했습니다. 하지만 국제 협력은 말처럼 쉽지 않았습니다. 미국과 중국 사이의 기술 패권 경쟁은 AI 안 전 논의를 복잡하게 만들었습니다.
허사비스는 과학에는 국경이 없다는 신념을 가지고 있 었지만, 현실의 AI 기술은 국가 안보와 직결된 전략 자산이 되어 있었습니다. 그는 서구권 리더들에게 "우리가 안전을 위해 속도를 늦추는 동안, 경쟁국이 위험 한 방식으로 앞서 나 간다면 어떻게 할 것인가"라는 질문을 수없이 받았습니다. 이에 대해 그는 "안전하지 않은 AI로 먼저 도달하는 것은 승리가 아니라 자살 행 위"라고 답했습니다.
그는 AI 안전성 연구 결과만큼은 오픈소스처럼 전 세계가 공유 해야 하며, 중국을 포함한 모든 국가가 참여하는 대화 채널을 유지해야 한다고 강조했습니다. 블레츨리 파크에서의 회의가 끝나고 나오는 길, 허사비스는 다시 한번 튜링의 동상을 바라 보았습니다. 암호를 해독해 전쟁을 끝냈지만 결국 사회로부터 버림받았던 튜 링의 비극적 인 삶은, 기술적 성취만으로는 충분하지 않다는 사실을 웅변하고 있었습니다.
허사비스는 인류가 이번에는 더 현명한 선택을 하기를 바랐습니다. 그는 AI를 만드는 것보다 AI를 다 스리는 법을 합의하는 것이 훨씬 더 어려운 '체스 게임'이 될 것 임을 직감하고 있었습니다. 그리고 그 게임의 말은 나무 조각이 아니라, 80억 인류의 운명이었습니다.
일자리의 변화와 '의미(Meaning)'를 찾는 인류의 과제 2024년 1월, 스위스 다보스에서 열린 세계경제포럼. 화려한 조명 아래 선 데미스 허사비스 는 평소의 과학적이고 분석적인 어조와는 조금 다른, 철학적인 화두를 던졌습니다. "우리 는 지금 산업혁명보다 10배 더 크고, 10배 더 빠른 변화의 초입에서 있습니다." 청중석에 앉은 경제학 자들과 기업가들은 숨을 죽였습니다.
산업혁명이 인간의 '근육'을 기계로 대체하는 과정이었다면, AI 혁명은 인간의 '두 뇌'를 대 체하는 과정입니다. 그리고 그 속도는 증기기관이 수십 년에 걸쳐 만든 변화를 불과 수년 만에 압축해서 보여주고 있었습니다. 허사비스는 AGI가 도래한 미래를 '근본적 풍요(Radical Abundance)'의 시대로 묘 사합니다. 지능이 전기처럼 어디서나 싸게 공급되는 세상입니다. AI가 신소재를 개발
해 에너지를 무 한정 생산하고, 모든 질병을 치료하며, 로봇이 식량을 재배하고 물류를 담당하는 세상입니 경제적인 관점에서 이것은 생산성의 폭발을 의미합니다. 재화 와 서비스의 비용이 0에 수렴하게 되고, 인류는 역사상 처음으로 절대적 빈곤에서 해 방될 수 있습니다. 하지만 이 장밋빛 전망 뒤에는 거대한 그림자가 드리워져 있습니다.
바로 '노동의 종말’입니다. 그는 경제학자들에게 "기존의 경제 모델은 붕괴할 것"이라고 경고했습니다. 인간의 노동 이 더 이상 생산의 필수 요소가 아닐 때, 임금 노동을 기반으로 한 자본주의 시스템은 작동 할 수 없습니다.
허사비스는 보편적 기본 소득(UBI)을 넘어선 '보편적 고소득(Universal High Income)'의 가 능성을 언급합니다. 단순히 생계를 유지하는 수준이 아니라, AI가 창출 한 막대한 부를 통 해 모든 인류가 풍요로운 삶을 누리는 비전입니다. 하지만 이것이 기술이 아닌 정치와 분 배의 문제임을 인정합니다.
"기술은 파이를 키울 수는 있지만, 파이를 어떻게 나눌지는 인 간이 결정해야합니다." 그의 목소리에는 기술자로서의 한 계와 시민으로서의 우려가 섞여 있었습니다. 더 심각한 문제는 경제적 분배를 넘어선 '존재론적 질문'입니다.
허사비스는 자주 묻 습니 "만약 기계가 우리보다 체스를 더 잘 두고, 시를 더 잘 쓰고, 심지어 과학적 발견조차 더 잘 해낸다면, 인간은 무엇을 위해 살아야 하는가?" 그가 평생 사랑했던 체스는 이미 AI가 인간을 초월한 영역입니다. 하지만 사람들은 여전 히 체스를 둡니다. 왜일까요? 그는 여기서 희망을봅니다.
"우리는 결과가 아니 라 과정에 서, 그리고 다른 인간과의 교감에서 의미를 찾습니다." AI가 아무리 아름다 운 음악을 만들 어도, 우리는 인간 연주자가 흘리는 땀방울과 그가 살아온 인생의 이 야기에서 감동을 받습니다. 허사비스는 AGI 이후의 시대를 준비하기 위해 우리가 '의미(Meaning)'를 재정의해 야 한다 고 말합니다.
직업이 곧 정체성인 시대는 끝날 것입니다. 그는 미래의 인류가 고대 그리스 의 철학자들이나 르네상스 시대의 귀족들처럼, 창조적인 탐구, 예술, 스 포츠, 그리고 인간 관계에 몰두하는 삶을 살게 될 것이라고 상상합니다. 노동의 고통 (Drudgery)에서 해방된 인류가 진정한 자아실현을 추구하는 시대입니다.
하지만 그는 이것이 저절로 오지 않는다는 것을 잘 알고 있습니다. 준비되지 않은 상태에서 맞이하는 노동의 상실은 대규모 실업과 정체성의 혼란, 그리고 사회적 폭동으로 이어질 수 있습니다. "사회가 아직 AGI를 맞이할 준비가 되어 있지 않다."
이것이 허사비스가 정책 입안 자들에 게 보내는 가장 강력한 경고입니다. 기술 발전 속도는 기하급수적인데, 사회 제도의 변화 속도는 선형적입니다. 교육 시스템은 여전히 20세기 공장 노동자를 길러 내는 방식에 머물 러 있고, 법률과 복지 제도는 AI 시대의 유연성을 따라가지 못하고 있습니다.
그는 지금이 야말로 기술자뿐만 아니라 철학자, 사회학자, 예술가가 머리를 맞대고 '인간의 목적'에 대 해 치열하게 고민해야 할 때라고 강조합니다. 책상 위에 놓인 태블릿에는 그가 좋아하는 SF 소설가 이언 뱅크스(Iain M. Banks) 의 '컬처 (Culture)' 시리즈가 띄워져 있었습니다. 초지능 AI가 관리하는 풍요롭고 평 화로운 우주 문 명을 그린 이 소설은 허사비스에게 영감의 원천이자 나침반입니다.
그 는 우리가 판도라의 상자를 이미 열었다는 사실을 부인하지 않습니다. 상자 밖으로 튀 어나온 온갖 재앙과 위협 들 속에서, 그가 필사적으로 붙잡고 있는 것은 상자 가장 밑 바닥에 남아 있던 '희망'입니다. 더 똑똑한 기계가 우리를 대체하는 것이 아니라, 더 성 숙해진 인류가 기계와 함께 별을 향 해 나아가는 미래. 그것이 지능을 푼 소년, 데미스 허사비스가 꿈꾸는 마지막 챕터입니다.
AGI와 미래 기술의 상징

이 책이 잠시라도 당신 곁에 머물렀다면, 다음 이야기가 세상에 나올 수 있도록 후원해 주세요.
(자발적 후원 부탁 구좌 : 농협 302-1096-0948-81 예금주 : 김경진)
