3년후 AI 초격차 시대가 온다(책)

3년후 AI 초격차 시대가 온다(책)
제목	3년후 AI 초격차 시대가 온다 - 3000퍼센트 가치 창출의 시작
원제
저자	정두희
옮긴이
그린이
출판사	청림출판
출간일	2019.7.12
쪽수	308
ISBN13	9788935212859
ISBN	8935212857

3년후 AI 초격차 시대가 온다, 3000퍼센트 가치 창출의 시작

1 책소개

AI 에 대한 책

2 책 읽은 이유

이번 년도 목표 중 하나는 AI 를 더 잘 이해하는 것이다. 이 목표를 달성하고자 교양수준의 책을 읽게 되었다.

3 기억하고 싶은 글귀

3.1 AI 기술의 취약점

모든 신기술에는 양면성이 있다. 특장점이 있지만 실제 활용하는 현장에서는 기술 본연의 한계에 직면한다. 인공지능도 만능 시스템처럼 인식되곤 하지만 그 나름대로 취약성이 있다. 인공지능에 대해 충분히 이해하려면 이 기술의 취약점도 직시해야 한다.

첫 번째는 데이터 의존도가 크다는 점이다. 인공지능 기술을 실제로 활용하려면 알고리즘을 학습시킬 수 있을 만큼 큰 데이터세트를 작성하거나 확보해야 하는데 그러기가 어려울 수 있다. 의료 분야의 경우, 환자의 진단 결과를 정확하게 예측하려면 방대한 데이터가 필요하다. 앞서 언급한 대로 수만 개의 유전자 정보, 수백 개의 의학저널 등의 지식뿐 아니라 방대한 양의 임상시험 데이터도 필요하다. 이러한 데이터를 확보하거나 데이터에 접근할 수 없다면 인공지능의 수혜를 입기 어렵다는 한계가 있다.

IBM 왓슨이 암 치료 분야에서 활약하고 있지만 한편으로는 추가적인 발전에 대해 회의론이 일고 있는 것도 사실이다. 의학전문매체(STAT)는 왓슨이 정확하지 않고 위험한 진단을 내린다고 폭로했고, 〈월스트리트 저널>도 왓슨이 실제 환자에게 미치는 영향이 제한적이라고 평했다. 이러한 평가의 배경에는 환자의 데이터 수집에 존재하는 한계가 있다. 왓슨은 의학 논문과 교과서 등 방대한 의료정보를 학습하고 있으나, 문헌자료와 연결할 실제 환자 데이터가 부족하다. 암환자를 진료하려면 개인 병력과 치료 결과, 과거 유사 환자 사례 등 다양한 데이터를 학습해야 하는데, 방대한 관련 데이터를 모으는 데는 현실적으로 어려움이 있다. 특히 희귀암이나 재발암 등에 대해서는 데이터 부족 때문에 의료적 성과를 내지 못하고 있다.

두 번째는 데이터의 편향성이다. 인공지능의 학습이 데이터로 진행되다 보니, 데이터 자체가 편향되어 있으면 인공지능의 판단 또한 편향될 수 있다. 아마존에서는 머신러닝을 기반으로 500대 컴퓨터를 동원해 구직자 지원서를 5만여 개 키워드로 분석하는 방식을 적용했다. 그런데 학습을 시작한 지 1년여가 지나자 이 시스템이 경력 10년 이상의 남성 지원자만 후보로 고르기 시작했다. 여성이라는 단어가 들어가면 감점을 하기도 했다. 그동안에는 IT 기업에 남성 지원자가 압도적으로 많았기 때문에, 이런 데이터를 기반으로 한 인공지능이 남성 편
향적으로 서류를 분류한 것이다.

이 문제를 해결하기 위한 방법으로 IBM은 AI 오픈스케일을 내놓았다. 편향된 데이터에 근거한 치우친 결과를 검증하고 바로잡을 수 있는 개방형 기술 플랫폼이다. 이 플랫폼은 인공지능이 적용된 시스템이나 운용 환경에 관계없이 AI가 도출한 의사결정 과정을 설명하고 투명하게 관리하며 AI 편향성을 탐지한다. 어쨌거나 데이터의 편향성 이슈는 모든 분야에서 고려될 수 있다. 인공지능이 사람보다 객관적인 판단을 내릴 수 있는지에 대해서는 조금 더 증명이 필요한 시점이다. 사람의 생명과 직결되는 자율주행에도 인공지능이 적용될 수 있기 때문에 이는 결코 사소한 과제가 아니다.

세 번째는 인공지능의 취지와 달리 인간의 노동이 아직 많이 필요하다는 점이다. 현재 시장에 있는 인공지능 서비스의 90%는 지도학습방식이다. 지도모드의 인공지능에는 인간이 데이터를 주입해주고 지도를 해주어야 한다. 사람이 데이터를 일일이 분류하고, 가공 작업까지 해야 한다. 물론 조직 내 여러 부서의 가용 데이터를 추출해서 통합해주는 인공지능 알고리즘도 존재한다. 그러나 일반적으로 아직까지는 알고리즘 지도를 위해 사람의 손과 시간이 많이 필요한 단계이다.

네 번째는 인공지능이 도출한 결과를 설명하기가 어렵다는 점이다. 딥러닝의 처리방식은 블랙박스다. 딥러닝이 수많은 데이터로 학습을 하고 정확하고 빠른 예측을 해내고 있지만, 어떠한 원리로 예측을 하는지는 과학자나 엔지니어도 알지 못한다. 과장해서 이야기하면, 그동안 보여준 성능을 믿고 맡기는 것이다. 가장 진보된 과학이지만, 상당히 과학적이지 않은 아이러니한 모습이다. 데이터 편향성이 나타나는 이유도 처리 과정이 이처럼 '깜깜이' 방식이기 때문이다. 개발자도 전후사정을 정확히 알지 못하기 때문에 잘못된 판단이나 윤리적인 문제에 봉착할 수도 있다.

다섯 번째는 간접학습의 어려움이다. 인공지능은 상당히 산업 특화적이다. 어느 특정 산업에서 성숙한 인공지능 머신은 다른 분야에서 똑같은 활약을 하지 못한다. 학습하는 배경과 데이터가 다르기 때문에 그대로 적용하지 못하는 것이다. IBM 왓슨이 진단 알고리즘을 개발해 헬스케어 시장을 개척하는 데 성공했지만, 같은 알고리즘을 금융시장에 활용하려면 데이터도 새로 확보해야 하고, 금융산업 전문가와 함께 학습을 새로 시작해야 한다. 알고리즘 적용방식이 거의 비슷하다 해도 환경이 바뀌면 재교육을 해야 한다는 점은 알고리즘의 확장성 측면에
서 한계점이라고 볼 수 있다.

간접학습의 어려움을 해결하기 위해 전이학습(Transfer Learning)이 연구되고 있다.

전이학습 관련하여 전이학습 쉽게 이해하기와 인공지능 전이학습과 응용 분야 동향 보고서를 읽으면 이해가 더 잘 된다.

3.2 인공지능 제품을 만든다는 것

인공지능 비즈니스의 3가지 요소

알고리즘(Algorithm)
데이터(Data)
비즈니스 모델(Business Model)

인공지능 기반의 비즈니스를 개발하는 데는 세 가지 핵심요소가 필요하다. 알고리즘, 데이터, 비즈니스 모델. 데이터가 풍부해야 인공지능 머신이 학습을 하여 사용자에게 맞는 서비스를 제공할 수 있다. 알고리즘이 있어야 데이터를 통해 사용자에게 제공할 결과물을 창출할 수 있다. 비즈니스 모델은 데이터나 알고리즘과 같은 기술적 자원을 토대로 사용자에게는 가치를, 기업에는 수익을 가져다주는 역할을 한다.

인공지능 혁신은 이 세 가지 요소를 기반으로 창조적인 응용을 하는 것이라고 볼 수 있다. 앞으로 머신러닝 기반의 AI 알고리즘은 수없이 쏟아져나올 것이다. 데이터의 양과 질도 기하급수적으로 향상될 것이다. 인공지능을 통한 비즈니스 혁신은 이전에 없던 새로운 가치를 만들어내는 일인데, 이러한 기술적 기반을 어떻게 가꾸느냐에 달렸다. 기술을 가장 먼저 개발하는 것 못지않게 기술에서 가치를 먼저 끌어내는 것도 중요하다. 애플은 아이팟, 아이튠즈, 아이폰 등을 선도적으로 내놓아 시장의 절대 강자로 발돋움했지만 관련 기술을 최초로 개발한 업체는 아니다. 최초로 기술을 개발하진 않았지만 관련 기술을 최초로 개발한 업체는 아니다. 최초로 기술을 개발하진 않았지만 참신한 방식으로 신기술을 활용해 수익성 높은 비즈니스 모델을 완성시킨 덕분에, 이 기술 분야에서 최고 강자가 될 수 있었다. 인공지능 기반의 비즈니스 혁신은 결국 기술의 창조적 응용이다.

(중략)

창조적 융합을 가장 잘 실천하고 있는 기업은 스타벅스다. 커피전문점과 인공지능의 조합이 왠지 어울리지 않아 보이지만 스타벅스는 이를 아주 자연스럽게 수행하고 있다. 이 회사는 최근 음성명령이나 채팅창을 통해서 주문할 수 있는 마이 스타벅스 바리스타' 서비스를 시작했다. 인공지능 챗봇 기술을 이용, 음성이나 채팅을 통해 마치 스타벅스 내 점원과 대화하듯이 주문을 하는 서비스다. 아마존의 가상비서 알렉사를 통해서도 스타벅스 커피를 주문할 수 있도록 했다. 스타벅스의 핵심은 고객과의 정서적 유대감을 형성하는 것인데, 인공지능 기술이 이를 더욱 강화해주리라 보고 다양한 AI 기술을 적극적으로 결합한 것이다. 스타벅스 창업자인 하워드 슐츠(Howard Schultz)는 "기술혁신은 브랜드를 강화하고 매장관리의 효율성을 개선하며 수익성을 높여주고 경쟁우위를 확대해 고객에게 스타벅스에서의 경험의 질을 높이는 기회를 만들 것"이라고 주장한다.

인공지능 생성기술은 다양한 영역에서 활용될 것이다. 정기적으로 나오는 잡지의 표지 디자인 영역에도 이 혁신기술이 적용될 수 있다. 스탠퍼드대학교 연구원인 로비 바렛(Robbie Barrat)은 머신러닝을 이용해 인공지능에 수천 점의 그림을 학습시켰다. 이후 생성적 적대 신경망(Generathe Adversarial Network, GAN) 기술을 적용해 직접 풍경화를 그리게 했다. GAN 기술은 인간의 개입이나 추가적인 학습 데이터 없이 인공지능 스스로 학습하게 하는 신경망 기법으로, 서로 대립되는 두 시스템이 상호경쟁을 통해 성능을 높이는 비지도학습법의 하나다. 가령 한 시스템은 위조지폐를 만드는 기능이고 다른 시스템은 지폐 위조 여부를 감지하는 기능일 경우, 두 시스템의 경쟁을 통해 성능을 향상시키는 것이다. 로비 바렛은 이 방식을 2주 정도에 걸쳐 적용해 완성도 높은 풍경화를 만들었고 이를 잡지 표지에 적용했다. 매주 새로운 디자인을 만들어내는 작업에는 이른바 창작의 고통이 따르고 만만치 않은 비용이 발생하지만, 인공지능을 통한 이러한 방식은 창작에 효율성을 가져다줄 것이다.

로고 디자인도 마찬가지다. 로고 디자인은 한 컷의 작은 이미지이지만 기업의 철학을 담아야하고 고객을 끌어들일 마케팅적 요소도 있어야 하기 때문에 고민도 많이 해야 하며, 따라서 수많은 재작업을 필요로 한다. 그런데 재작업의 상당수를 인공지능으로 해결할 수 있다면 로고 제작에 드는 시간과 노력을 단축할 수 있을 것이다. 인공지능을 이용해 자동으로 기업 로고를 디자인해주는 스타트업, 테일러 브랜드(Tailor Brands)는 이 부분을 공략했다. 고객이 웹사이트에 접속해서 회사에 대한 기본 정보를 입력하고 원하는 디자인 스타일을 선택하면 인공지능이 자동으로 다양한 브랜드 로고를 디자인해준다. 무료로 말이다. 2014년에 설립된 이 스타트업은 3년 동안 이미 4,500만 개의 로고를 만들어냈다.

3년후 AI 초격차 시대가 온다(책)

목차

1 책소개

2 책 읽은 이유

3 기억하고 싶은 글귀

3.1 AI 기술의 취약점

3.2 인공지능 제품을 만든다는 것

둘러보기 메뉴

개인 도구

이름공간

변수

보기

더 보기

검색

둘러보기

도구