오늘은 수학관련 도서 독후감 내용입니다. 선정한 책은 수학의 쓸모입니다.
이 책은 수학, 구체적으로는 인공지능의 수학에 대한 이야기입니다. 사실 수학에 대한 이야기라기 보다는 통계학에 대한 이야기 따라서 책의 제목도 통계의 쓸모라고 하는 것이 더 적절할 수도 있습니다. 원서의 제목은 AIQ: How People and Machines Are Smarter Together인데 “인공지능지수” 정도로 번역할 수 있는 제목입니다. 수학에 촛점을 맞추었다기보다는 인공지능에 관한 수학에 촛점을 맞추고 있는 책입니다.
읽기가 쉽습니다. 수학에 대한 이야기를 사례와 역사를 통해 소개하고 있어서 부담스럽지 않습니다. 통계학과 특히 인공지능의 기초에 대해서 관심 있는 모든 학생들에게 강력하게 추천하고 싶은 책이네요.
모두 7개의 장으로 나누어져 있는데 두 명의 공저자 닉 폴슨과 제임스 스콧은 각 장마다 주제와 관련된 역사적인 예시를 큰 소재로 소개하면서 이야기를 풀어나가고 있습니다.
1장에서는 2차 대전 중에 연합군 비행기가 살아 돌아올 확률을 계산하는 문제가 소개되고 있습니다. 본문을 조금 볼까요?
2차대전 당시 연합군 해군은 폭격을 마치고 돌아온 비행기에서 눈에 띄는 손상 패턴을 발견했다. 바로 대다수의 총알 구멍이 동체에 나 있었던 것이다. 해군은 다음과 같은 명백한 결론에 도달했다. 동체에 장갑을 덧대자….
어때요? 여러분이라면 소중한 비행사들의 생명과 항공자산을 보호하기 위해서 어떤 조치를 취할 수 있을까요?
여러분의 조치는 나치의 위협을 피해 유럽을 떠나 미국에 자리잡은 헝가리 출신의 유대인 통계학자 에이브러햄 왈드가 제시한 해법과 어떤 차이가 있을지 탐구하는 내용으로 독후감을 작성한다면 여러분의 독창적인 생각이 세특에 기록될 수 있습니다. 아마 왈드가 제시한 해법보다 더 좋은 해법을 제시할 수 있다면 여러분은 당장 넷플릭스에 찾아가 새로운 추천 모형을 개발했다고 큰 소리 칠 수도 있습니다.
2장에서는 헨리에타 레빗이라는 여성 천문학자의 업적이 소개되고 있습니다. 여성이 과학계에 발을 들여놓기가 쉽지 않았던 시절, 레빗의 관심은 맥동변광성을 찾는 일에 있었습니다. 레빗은 한 가지 중요한 사실을 발견했는데, 맥동변광성이 밝아졌다 어두워졌다를 반복하는 주기와 그 밝기 사이에 성립하는 패턴을 발견했던 것입니다. 이 발견이 있었기 때문에 그 유명한 허블의 우주팽창 법칙도 가능했다고 저자는 강조하는데요, 나아가 패턴이라고 표현되어 있는 새로운 규칙의 발견은 인공지능에게도 아주 중요하다고 지적하고 있습니다. 다음 내용을 볼까요?
1. AI에서 패턴이란 입력을 예상되는 출력에 대응시키는 예측 규칙이다.
2. 패턴 학습이란 훌륭한 예측규칙을 한 데이터 집합에 맞추는 것이다.
아마 다중회귀분석이라고 하는 용어에 대해서 들어보지 못한 분들이라고 하여도 본문을 통하여 그 내용을 충분히 이해할 수 있을 듯 하네요. 사실상 다중회귀분석에 대한 내용의 뼈대는 저자가 충분히 이해시켜 주고 있기 때문에 그 내용을 독후감에 반영하여 작성할 수 있겠습니다.
3장에서는 1968년 수천킬로미터 거리의 어느 지점에선가 실종되었던 미국의 핵잠수함 USS 스콜피온에 대한 이야기가 실려 있습니다. 몇 개월간의 허탕 끝에 미 해군 특수작전국의 수석 과학자 존 크레이븐이 투입되었는데 그는 조건부확률의 개념을 적용한 수색 방식을 통해 침몰한 잔해를 찾아낼 수 있었습니다.
4장에서는
역사상 최초로 컴퓨터에 영어를 이해시킨 사람, 그레이스 호퍼의 이야기가 소개됩니다.
컴파일러라는 개념은 컴퓨터 역사에서 가장 중요한 소프트웨어 혁명이다.
바로 이 컴파일러라는 개념 자체를 만든 사람이 그레이스 호퍼입니다. 컴파일러를 통해 소수의 전문가를 제외한 대부분의 프로그래머들은 지금의 우리가 코딩이라고 부르는 바로 그 방식, 프로그래밍 언어를 이용한 방식으로 컴퓨터 프로그램 만들기를 할 수 있게 되었습니다.
그 다음 단계는 무엇일까요? 컴퓨터에게 실제 인간의 자연어를 익히게 하자라는 것이었습니다.
전문가들은 길고 긴 시간 동안 컴퓨터에 많고 많은 명시적 규칙들을 주입하는 방법으로 자연 언어를 이해시키려 하였습니다.
하지만 결국에는 실패했습니다.
1980년대 들어와서 “그냥 데이터를 이용합시다”라는 주장이 힘을 얻기 시작했습니다.
본문에서는 weather report와 whether report를 예시로 제시하고 있는데, 간단히 비유하자면 예를 들어 시행착오와 시행차고로 바꾸어 볼 수 있습니다. 시행착오와 시행차고를 구분하는 일은 사람한테는 쉽습니다만 컴퓨터에게는 쉽지 않습니다. 이전에는 이런 것을 걸러내기 위해서 많은 규칙들을 컴퓨터에게 알려주었어야 했습니다. 하지만 성과는 신통치 않았다고 합니다. 문법적인 규칙을 가지고 컴퓨터에게 언어를 가르치는 일은 실패했습니다.
그런데 지금은 자료를 찾습니다. 방대한 인터넷 자료들이 있습니다. 그러면 시행착오라는 표현은 상대적으로 아주 많이 나오겠지만 시행차고라는 표현은 어쩌다 한 번 나오는 정도일 것입니다. 바로 이러한 통계를 이용하는 것입니다. 여기에서 여러분들은 다음 두 가지 종류의 지식을 구분할 수 있게 됩니다.
방법적 지식과 사실적 지식
방법적 지식이란 직관적이고 실용적인 지식을 의미합니다.
사실적 지식이란 무엇일까요? 두 가지를 구분하는 것에 초점을 맞추어 독후감을 작성하고 나아가
구글의 단어 벡터인 워드투벡Word2Vec 모형을 간단히 모방한 추가 탐구를 기획할 수도 있으리라 생각합니다. 단어벡터란 하나의 단어에 그 단어에 다른 단어들이 얼마나 자주 연결되는지를 수치화해서 나타낸 수의 모임인데요 다음과 같은 가정에 기초하고 있습니다.
기계는 의미를 이해하지 못하기 때문이다.대신 단어연어 통계를 이해한다. 즉 특정 단어가 인간이 쓴 실제 문장에서 대체로 어떤 단어들과 같이 등장하는지를 이해한다.
그래서 다음과 단순한 질문이 굉장히 중요해집니다.
단어를 숫자로 어떻게 변환해야 비슷한 의미를 지닌 단어들이 비슷한 숫자들로 변환될 수 있는가?
이 부분은 다양한 탐구가 가능하며 자신만의 독창적인 의견을 제시하기에도 적합한 부분이라 생각합니다. 아마도 여러분들은 이제 다음과 같은 덧셈, 뺄셈의 의미도 이해할 수 있게 됩니다.
런던-영국+이탈리아=로마
5장에는 뉴턴의 이야기가 나옵니다.
영국은 오랫동안 은본위제 방식의 화폐제도를 유지하고 있었습니다. 은본위제란 동전의 무게와 은 함량에 따라서 화폐의 가치가 결정되는 제도입니다. 하지만 같은 액면가의 동전이라 해도 은 함량이 다르다는 것이 문제였다고 합니다. 기계로 만들기 전까지는 동전을 직접 모루에 대고 망치로 두드려서 만들었기 때문에 은함량이 조금씩 들쭉날쭉한 것은 필연적이었죠. 그래서 은함량에 대한 주기적인 조사가 이루어졌습니다. 방식은 이렇습니다. 견본화폐검사라는 방식입니댜.
조폐국이 발행하는 1파운드짜리 은 동전 60개 마다 1개씩 따로 빼둔다. 이 동전을 몇 년에 걸쳐 모으면 수천 개가 되는데 세공판정단이 법적 기준에 맞는지 확인한다.
여기에 생각해 볼 문제가 있습니다.
실제 영국에서는 1345년 이래 대략 +-1%정도로 그 기준을 정해 놓았습니다.
핵심적으로 생각해 볼 문제는 다음과 같은 질문입니다. 만약 동전 1개 무게의 허용 범위가 목표 무게로부터 +-1그램이라면, 많은 동전의 평균 무게에 대한 허용 범위는 얼마여야 할까요? 당연히 +-1그램인가요?
무엇이 문제일까요? 은퇴해서 편한 여생을 보내라는 조언을 뿌리치고 조폐국에 들어가 제 2의 인생을 시작한 뉴턴조차 꿈에도 생각하지 못한 문제가 있었습니다. 만약 동전을 10번 던져서 앞면이 3번 나왔다고 해보죠. 충분히 그럴 수 있습니다. 그런데 만약 동전을 1000번 던져서 앞면이 300번 나왔다고 해 보죠. 이것도 충분히 그럴 수도 있는 상황인가요? 이 부분을 이해했다면 좋은 독후감을 작성할 수 있습니다.
6장에서는
식도암 발병과 특정 약품과의 관계, 피임 실패율, 자동차 사고율을 소재로 하여 가정의 중요성과 잠복변수에 대한 소개가 나오고 있습니다.
전형적인 미국인이 자동차 사고를 내지 않고 1년을 무사히 보낼 확률은 99퍼센트라고 합니다. 실제 통계를 통해서 얻을 수 있는 수치입니다. 그렇다면 10년 연속 무사고일 확률은 얼마인가요?
P(10년 연속 무사고)=0.99 0.99 . … .0.99 = 0.904
이 계산은 맞을까요?? 간단하지만 교과서에서는 다루어지지 않는 내용에 대한 탐구로 세특의 내용을 채울 수 있는 좋은 소재네요.
7장에서는
크림반도의 천사, 나이팅게일에 대한 이야기가 소재로 다루어집니다. 나이팅게일의 대표적인 유산이 세가지 있다고 소개됩니다.
첫번째 유산은 잘 알려진 대로,
헌신적이며 보다 현대적인 간호사의 모습을 각인시켰다 입니다.
두번째 유산은 의외입니다. 나이팅게일의 첫번째 전기 작가인 쿡은 자신의 주인공에게 열정적인 통계학자라는 별명을 붙여주었다고 합니다. 맨드라미 다이어그램이라는 통계처리방법을 직접 만들기까지 하였으니까요. 인터넷에는 로즈 다이어그램이라고 검색이 되네요.
세번째 유산은 증거기반 의료체계를 출발시켰다 입니다.
의료 데이터 수집과 분석에서 전문성의 새로운 표준을 세우는 데 크게 공헌하였다는 내용입니다. 나이팅게일이 대해서 얼핏 알고 있었던 내용과는 사뭇 색다른 내용이라서 역시 독후감의 좋은 소재가 될 수 있는 내용입니다.
이제까지 수학의 쓸모에 대한 소개였습니다. 전체를 다 읽어도 부담없이 좋겠고 한 두 장의 내용만 골라 읽어도 좋을 책입니다. 인공지능의 원리에 대해서 관심이 깊다면 특히 2장과 4장의 내용을, 통계학에 더 관심이 있다면 1장과 5장, 인문학적 관점에서 통계학을 보고자 한다면 6장의 내용을 관심있게 읽어본다면 좋겠습니다. 책에 대한 내용을 심화 탐구하여 더욱 좋은 독후감을 작성해 보시길 바랍니다.