[서평] 박태웅의 AI강의(Chat GPT와 인공지능에 관한 내용)

728x90

먼저 서평은 처음 작성해보는 것이라 어설플 수 있지만, 개인적으로 책을 모두 읽기 어려우신 분들과 인공지능을 활용하는 일을 한다거나, 하지 않더라도 관심이 있는 사람들이 간단하게 요약해서 볼 수 있도록 줄거리와 함께 내 생각을 중간에 조금씩 첨언해서 작성했다.

책 소개

먼저 이 책은 AI강의라길래 인공지능을 일반인이 어떻게 접근하면 좋을지에 대해 다룬 책이라고 생각했고, 얼추 맞는 말이긴 하다.

정확하게는 인공지능을 활용하는 방법에 대해서는 다루지 않으며, 챗GPT의 활용부터 인공지능 법안과 위험성에 대해까지 인공지능에 대해 모두가 알았으면 하는 내용을 담은 책이라고 소개하고 싶다.

이 책의 저자는 한빛미디어 이사회 의장으로 IT분야에 오래 몸을 담으신 분이시다.

요약 및 첨언

[1강]

먼저 챗gpt란 있는 그대로 직역을 하자면, 트랜스포머 모델을 기반으로 사전에 학습되어있어 무언가를 생성해내는 대화형 인공지능이란 뜻이다.
챗gpt가 이전 대화형 인공지능과의 차이점은 인간과의 대화를 통해 학습을 이루지 않는다는 것과 그 과정에서 매개변수를 조절하지 않는다는 점이다.
물론 A는 B가 될 수 있다고 대화를 통해 말한다면, 그 대화중에는 이를 적용시키나, 세션이 만료되는 것처럼 대화가 끝나고 새로운 대화창을 통해 다른 대화를 할 경우 적용이 되지 않는다는 것이다.

챗gpt의 단점은 강화학습을 통한 자유도가 0으로 설정되어있지 않다는 것이다.
이 부분은 어떻게 보면 장점이 될 수도 있다.
먼저 그 이유를 말하기 전에 자유도에 대해 먼저 언급을 하자면, 자유도는 보통 0~1 사이값으로 많이 설정을 한다고 하며, 자유도가 0이라는 것은 정답만을 대답하도록 설정한 것이라고 한다.
이 부분이 단점이 되는 이유는 명백한 사실인 닐 암스트롱이 세계에서 달에 첫 착륙자이다 라는 것을 잠재된 패턴을 통해 확률을 기반으로 대답하는 것이 옳지 않기 때문이다.
반대로 장점도 되는 이유는 그만큼 전문성을 갖추어 나갈 수 있고 하나를 가르쳤을때 그대로 하나로만 활용되는 것이 아닌 다양한 활용법을 제시하듯 답변을 도출하기 때문이다.

LLM의 큰 단점이 있는데 그 중 하나는 환각현상이다.
환각현상(할루시네이션)의 경우 실제로는 존재하지 않은 근거를 들어 마치 사실인 것 마냥 답변을 해주는 현상을 말한다.
이 책에서는 미국 파우스트 박사의 사례를 보여주었다.
챗gpt가 늑연골염이 경구 피임약으로 유발된다는 답변을 제시했고 이는 사실이 아니었기에 근거를 요구하자, <유러피안 저널 오브 인터널 메디슨>에 논문이 있다고 했으나 이는 명백한 거짓이라고 밝혀졌다고 한다.
이렇게 거짓말을 하자 왜 거짓된 답변을 제공했냐고 하니 거짓을 부인하기까지 했다고 하며, 그 이유는 트랜스포머 모델로 인해 가장 그럴듯한 답변을 하도록 학습되어있기 때문이라고 했다.
내가 이해한 부분을 첨언하자면, 강화학습을 통해 자유도를 0으로 설정하지 않은 이유도 대단한 비중을 차지하고 있으리라.
한 단어가 어떤 단어들과 많이 사용됐는지, 그리고 얼마나 연관성이 있는지를 예측해서 의미있는 말을 도출해내는 것을 목표로 하는 것이 트랜스포머 모델인데, 이로인해 인간과 유사하게 학습하고 사고하도록은 구현하지만, 중간에 샛길로 빠져버리는 현상들도 자꾸 생길 수밖에 없는 것이다.

두번째 큰 단점으로는 프롬프트 인젝션 공격이 있다.
프롬프트란 챗gpt에게 우리가 작성해서 입력한 글들을 말하고, 어떻게 묻는지에 따라 활용도가 달라질 수 있다.
그리고 이러한 부분의 취약점을 파악해 악용한다면 인공지능의 규칙을 위배한 행동을 하게 만들 수 있는데 이것이 인젝션 공격이다.
거대언어모델의 특징이 이러한 조작에 취약하다고 한다.
이 책에는 검색엔진 빙에 챗gpt를 접목한 빙챗의 사례가 소개되었고, 이 프로젝트에서 빙챗은 공격성을 표현해보이기도 하며 자신만의 원칙을 지키는 것이 중요하다고 대답한다.
이를 통해 마이크로소프트사는 귀사의 강화학습을 통해 지켜오던 경계가 쉽게 허물어지는 것을 깨닫고 하루에 채팅 제한을 두도록 조치를 취했다고 한다.

추가적으로, 얼마전에 알게되었는데 최근 프롬프트 엔지니어링이라고 이러한 거대언어모델을 통해 핵심적인 부분을 얻어 시간을 단축하고 효율을 증진시키는 기술을 배워 개발자라거나 다양한 부분에서의 활용을 가르치는 것도 많이 늘어나고 있는 추세다.

[2강]

챗gpt가 인기를 끄는 이유는 창발성 때문인데 책의 저자는 느닷없이 나타나는 능력이라고 직역해 표현했다.
이러한 거대언어모델이 추가적인 학습없이 특정 분야에 대한 질문을 하면 바로 답변을 해주는 특성을 가지고 있고, 이해를 돕기 위해 예제를 같이 제시하면서 질문한 것에 답변하는 것을 퓨샷 러닝이라 하고, 예제가 주어지지 않은채 질문에 바로 답변을 하는 것을 제로샷 러닝이라고 하며 이 두가지 방식을 통틀어서 질문 속에 배운다는 뜻으로 인 콘텍스트 러닝이라고 한다.
나 역시 프롬프트를 작성할 때, 챗gpt 라는 것을 처음 사용했을 때는 제로샷 러닝 방식만을 사용해야 하는 줄 알았지만, 환각현상을 겪은 후로눈 퓨샷 러닝 방식을 통해 명확한 사실을 도출해내게 하려고 여러 시도를 해봤다.
물론 아직도 챗gpt를 온전히 믿는 것은 아니지만, 어느 정도 명확한 사실에 대한 정보 요약 정도로는 활용하고, 아는 것과 같으면 검토를 생략하지만, 완전 처음 접하거나 생소한 부분이라면 다시한번 서칭을 통해 해당 내용을 검토하며 활용하고 있다.

챗gpt에서 창발력은 생각의 연결고리에서도 나타나는데 단계적으로 추론하는 능력에서 나타난다는 말이다.
인공지능은 논리적인 추론을 어려워하기 때문에 논리적인 추론만으로 받아들이지 않고 중간 추론 단계를 짚어주게되면 생각의 연결고리를 만들어 추론을 통해 정답에 이르게 되는 것이다.
이 방식은 더 많은 추론 단계가 필요한 곳에 추가 계산을 할당하고, 모델이 특정한 답에 어떻게 도달했는지를 확인해 잘못된 경로였다면 이를 직관적으로 파악할 수 있게 해주며, 자연어를 통해 해결가능한 일을 (이론적으로)가능하게 하고 질문의 단계적 추론의 예시를 포함하는 것으로 쉬운 결론 도출이 가능하다는 다양한 장점을 가진다.

1강 마지막 부분에 프롬프트 엔지니어링에 대해 작성해뒀는데 2장에서 이 부분이 언급되었고, 초보자들도 프롬프트를 잘 작성하는 방법에 대해 셰인 포자드가 말한 내용을 인용했는데 다음과 같다.

1. 단계적 추론을 유도하는 말을 덧붙인다.
2. 역할을 부여해 상황을 구체화 시킨다.
3. 요구하는 결과물의 포맷을 지정한다.
4. 원하는 바를 구체적으로 지정한다.

이 방법은 아마 프롬프트를 사용해본 사람들이면 자연스럽게 익혔을 것이라 생각하는데 나 역시 누군가에게 배우기보단 프롬프트 활용 초보자를 벗어나기위해 자연스럽게 익혀졌던 방법인 것 같다.

2강에서는 챗gpt가 AGI의 시초급이라는 것과 지능을 가졌다는 말이 맞는지에 대해 중점으로 다루고 있다.
변호사 시험도 패스할만큼의 전문적인 지식에는 정답에 가까운 답변을 출력하고 근거를 제시하거나 인지한 부분을 표현하지만, 간단한 상식 문제에서는 이해할수 없는 답변을 내놓고는 하는데 이러한 문제로 지능이 있다고도 없다고도 하기가 어려운 것 같다.

거대언어모델의 한계는 언어와 사고가 분리되어있게 때문이며, 언어를 통해 규칙이나 패턴을 지식에 포함하는 것을 형식적 언어 능력, 언어를 이해하고 사용하기 위해 필요한 인지 능력을 기능적 언어 능력이라고 하는데 챗gpt같은 이런 거대언어모델은 언어를 통해 표현해내는 메신저로 활용하고 형식적 언어 능력을 갖춘 인간 사고에 개한 것은 불완전한 모델이라고 한다.
여기에 내 의견을 조금 더 추가를 하자면, 확실하게 아직은 이러한 부분에 있어 지능이 있다 없다를 정확히 판별하는 지표가 없기 때문에 이러한 상황 자체로도 불완전한 것이 아닐까 하는 바이다.
어떤 답변에서는 확실히 지능을 보이지만, 그렇다고 전혀 이해할 수 없게 돌아가는 문제들에서는 지능이 있는게 맞는건지 보이는 이러한 딜레마 현상 자체를 우리가 쉽게 판별하기는 어려운 것이 맞다.
그러나 지능의 여부가 꼭 우리가 납득할 수 있는 답변과 정답만을 추구하는 것은 아니라고 생각하기 때문에, 어느 단계까지 올라야 지능이 있다고 판별한다는 등의 지표를 우리가 함께 고민해봐야하지 않을까 생각한다.

[3강]

3강에서는 챗gpt와 다른 기업들의 거대언어모델의 케이스와 비교로 운을 띄운다.
아무래도 오픈 AI사를 통해 챗gpt가 공개되고 수많은 사람들의 이목을 끌게 되면서 생성형 ai가 엄청나게 급부상하게 되었고, 이를 통해 관련 인공지능을 개발해 출시하는 기업들이 많아진 것이 사실이다.
마이크로소프트 사의 경우 한 보도에 이르면 선구주자로서 연구와 개발을 이끌지 못해 ai윤리 팀이 해고된 것 같다고 한다.

그리고 또 하나로 챗gpt가 해당 사이트를 학습해 오리지날을 무너뜨린 것으로 스택오버플로우 사례를 가져왔는데, 챗gpt가 공개된 이후로는 스택오버플로우의 방문자가 급감하고 개발자들이 챗gpt를 통해 코드를 짜달라고 부탁을 하는 것이 늘었다는 것이다.
나의 사례를 첨언하면, 처음으로 개발관련 공부를 원해서 택했던게 flutter 였는데, 당시에 null-safety로 인해 이슈가 많고 자료를 구하는 것은 공식 문서 외엔 방법이 거의 없던 수준이었다.
그러나 개발 관련으로 공부를 처음해보니까 공식문서는 마냥 어렵고 번역기 돌려서 이해하기 불편하다는 이유로 그냥 같이 스터디 하는 분들에게 묻곤했고, 캡스톤 디자인을 할 때만 스택오버플로우를 사용했지만 그 마저도 flutter 유저가 적은 상황에다 내가 영어를 잘하지 못해 원하는 답을 찾기 어려웠던 경험이 있다.
그래서 인공지능과 데이터 공부를 시작할 때, 챗gpt 덕을 보기 쉽다는 트렌드가 너무나 고마웠고 크롤링에 대해 배운적이 없기에 크롤링 코드를 짜는 것을 부탁하거나 다른 코드들을 부탁하기도 하는 등 누군가에게 물어볼 생각은 안했다.
지금 지식 상태에서 다시 한번 과정을 하라한다해도 나는 챗gpt를 쓸 것이고, 대신 관련 수많은 강의들과 도서를 참고하는 방법을 추가로 채택해 이해도를 넓혀보려 할 것이다.

막바지에서는 챗gpt의 무결성에 대해 의문을 제기하는 것을 포함해 이러한 생성형 ai로 인해 자부심을 가지고 일하던 3d 디자이너의 일거리가 대체된 사례를 통해 인공지능이 사회에서 어떤 역할까지 먹었는지에 대해서도 건단하게 다루고 있었다.

[4강]

미디어는 메세지이다.
소셜 네트워크를 통해 각자의 심정이나 상태 등을 자유롭게 표현할 수 있다.
그러나 이러한 매체와 전자기기의 발달로 인해 우울감이나 자살율이 점차 높아지고 있는데, 전자기기를 장시간 사용한 사람일수록 더 높게 나타난다고 한다. 여러번 이와 관해 조사를 하고자 하는 사람들이 있었으나, 소셜 네트워크의 내부 데이터를 구할 수 없기에 좌절되었다고 한다. 전체적인 내용은 책 내용을 언급하기보단 이 외의 연령대나 성별에서의 갭차이를 개인적으로 알고있지 않기 때문에 이정도로만 다루겠다.

실제로 페이스북과 인스타그램에서는 이와 관련해서 기밀로 조사를 한바가 있었으며, 이 기밀 문서에서는 소셜 네트워크를 통해 자기 비교를 하는 것으로 인해 정신건강에 좋지 않다는 결과와 보고를 했다는 정황이 드러났지만 마크 저커버그는 이와 관련된 부분을 숨기고 있다.

실제로 페이스북에서는 MSI라고 부르는 것을 시행해 좋아요를 표시하면 1점, 화나요나 슬퍼요 등의 감정 표시는 5점, 공유하기나 긴 메세지 답글 등은 30점으로 측정해 알고리즘을 통해 피드에 노출을 더 많이 되도록 했는데 좋아요는 1점인데에 반해 화나요와 같은 표현에는 5점으로 표현한 것을 더 높게 평가해서 결과적으론 알고리즘이 분노와 관련된 부분에서 더 많은 노출을 일으켜 의미있는 상호작용이 아니라 자극적이고 선정적인 게시물을 올려야 한다는 압박감을 주는 것이 아니냐는 의견이 나왔다.

뉴스 기사들도 마찬가지다.
서로 더 많은 노출수를 갖기 위해 자극적으로 제목을 작성하거나, 해외 뉴스를 과장해서 올려 사실이 아닌 부분을 보도하는 등의 문제가 이미 여러번 확인되었다.
그 이유는 매체의 발달로 종이 신문을 구독해서 보는 사람들이 적어지고 인터넷을 통해 기사를 많이 접하는데, 그 중 대부분이 네이버를 통한다고 한다.
네이버는 노출수와 클릭수를 통해 광고수익을 분담해주기 때문에 한 기자가 하루에 여러개의 기사를 작성해 올려야만 수익을 더 많이 받을 수 있고, 그렇기 때문에 직접 취재를 할 시간이 부족하다는 이유와 수익을 더 많이 받으려 클릭을 유도해야하기 때문에 서로 베끼는 양산형 기사가 넘쳐나오고 있다.

이러한 부분들이 우리 사회에 영향을 미치고 있는 것이 확실하며, 인공지능은 이러한 시스템, 체계들보다 더 큰 위력을 가지고 있다.

[5강]

이번 장에서는 인공지능에 인간이 대응할 수 있는 방안에 대해서 다룬다.
올해를 기준으로 10년 전 독일의 산업 4.0과 노동 4.0에 대한 백서는 녹서를 기반으로 독일 전체 사회 구성원의 고민과 답변을 통해 만들어졌다.
우리나라는 이 백서에서 산업 4.0만 내용을 활용해서 공론화를 시켰다는데, 개인적으로 독일 사회와 인공지능을 다루려고 하는 부분이나 전체적인 사회 규율이 큰 틀은 비슷하나, 한국 사회와 다른점이 분명히 존재하기 때문에 한국 정부에서는 다시 한번 더 다양화를 시켜 의견을 모았어야 하고, 산업이 발전되는 방향성에 따라 노동에도 반드시 영향이 미쳐지기에 노동에 댜한 백서도 함께 공론화를 했어야 한다고 생각하는 바이다.

그리고 그 외에 윤리나 도덕적으로 판단한 규율 등에 대해서도 언급이 되어있는데 그 중에서도 유럽연합의 인공지능 법에서 인공지능이 가져올 위험에 대해 4가지 수준으로 분류하는 것도 함께 다루고 있다.

결론적으로 저자가 이 챕터에서 전달하고자 하는 메세지는 다음과 같다고 판단했다.

인공지능을 개발하고 연구하는 것도 중요하지만, 그만큼 위험성을 다루고 이와 관한 부분을 연구해나가는 것도 매우 중요하다.

실제로 인공지능으로 생성한 알고리즘으로 인해 의도하지 않은 차별이 생성되거나 개인정보가 침해 되는 등의 다양한 문제 상황들 속에서 인공지능의 역기능적 측면으로 인한 사회적 우려에 대해 뒷전으로 두지 않고 더 중요하게 생각하고 명확한 기준 선을 지킬 수 있도록 올바른 판단과 규제 역시 있어야 한다는 뜻이다.
그리고 한국 사회는 더 넓은 의미로 인공지능 법안을 구체화 시켜야 할 필요성을 느껴야 하고, 실천해야 한다는 것을 전달하고 있다.

추가로 한국 사회에서는 데이터를 한글 문서나 pdf 파일을 포맷으로 하고 있는 것을 가장 큰 문제로 꼽는다.
문제가 되는 이유는 파운데이션 모델을 생성하기 위해 법률과 관한 데이터들이 필수적으로 들어가야 하지만, 컴퓨터의 공식 포맷이 아닌 관계로 자료를 학습할 수 있는 기회를 우리가 차단하고 있다는 것이다.
또한, 정부의 국세 데이터는 지방 정부에서 활용하지 못하도록 법이 제정되어있어 지방정부는 복지정책을 데이터 없이 활용하고 있는 현실을 비판했다.

그리고 이미 오래전 OECD 암호화정책 권고안을 통해 암호화에 대해 다룬 부분을 한국 사회는 지키지 않고 있다며 이에 대한 내용을 금융권의 공인 인증서로 꼽았다.
공인 인증서라는 암호화 수단을 강제로 채택해 하나만을 사용하게 했고, 이러한 강제성으로 지문/안면 인식 등의 기술이 설 수 있는 자리가 없어 해외 기업에서 선취하게 되었다.
이러한 공인 인증서가 끝까지 있었던 데에는 한국의 법안이 잘못되었고, 이 법의 내용은 공인 인증서를 사용한다면 금융기관의 챡임을 면하게 해주는 것이라고 한다.
덧붙여 암호화는 사람을 보호해야 하는데, 금융기관을 보호해주기 위해 활용되었다고 비판했다.

마지막으로 저자는 인공지능 법안을 다시 제대로 지을 것을 요구하며 하지말아야 할 일과 해야할 일을 제시한다.

하지말아야 할 일은 급부상 하는 산업군에 대한 관련 학과를 만들고 자격증을 만들고 10만 인재를 양성하겠다 라는 말들과 시대착오적 행정에 대해 언급한다.
해야 할 일은 기초 과학을 육성해 수학적, 과학적 지식을 제대로 육성하는 것을 중요하게 여기자는 것이다.
그리고 연구개발에 대한 지원을 단순히 주제만을 따라가는 것아 아닌, 마라톤을 하듯 연구자를 육성하는 것을 목표로 성공과 실패에 상관없이 경험을 쌓는 연구자를 만들어나가야 한다고 제시한다.

맺음말

나는 입사해서 이해하지 못하거나 지식이 부족해서 문제가 생길까봐 이 책을 도서관에서 빌려 읽게 되었지만, 인공지능에 대해서는 현재 관심없는 사람이 적은만큼 중요하기도 하고, 챗GPT나 하이퍼클로바를 사용해보지 않은 사람이 드문만큼 꼭 알아야할 지식들에 포함된다고 생각한다.

그렇기 때문에 더더욱 이 책을 한번 시간내어 읽어보며 인공지능으로 어떤 부분들이 변화하고 있고, 그를 위해 어떤 부분이 중요한지를 함께 알았으면 좋겠다.

728x90

저작자표시 비영리 변경금지

'데이터' 카테고리의 다른 글

[딥러닝] Tensorflow와 Pytorch 간단하게 비교해보기 (1)	2024.09.05
[크롤링] 웹 크롤링 kbs 뉴스 데이터로 직접 해보자! (Selenium 활용) + 다음페이지 이동기능 및 RSS (0)	2024.03.11
[크롤링] 웹 크롤링 kbs 뉴스 데이터로 직접 해보자! (Selenium 활용) + Trouble Shooting (1)	2024.03.11
[크롤링] 웹 크롤링 kbs 뉴스 데이터로 직접 해보자! (Beautifulsoup 활용) (0)	2024.03.11
[크롤링] 웹 크롤링에 대한 기초 지식을 알아보자! (0)	2024.03.11

포키의 개발 공부

[서평] 박태웅의 AI강의(Chat GPT와 인공지능에 관한 내용)

책 소개

요약 및 첨언

[1강]

[2강]

[3강]

[4강]

[5강]

맺음말

'데이터' 카테고리의 다른 글

티스토리툴바

[서평] 박태웅의 AI강의(Chat GPT와 인공지능에 관한 내용)

책 소개

요약 및 첨언

[1강]

[2강]

[3강]

[4강]

[5강]

맺음말

'데이터' 카테고리의 다른 글

관련글

티스토리툴바