-
인공지능 시대인데, 최소한의 코딩 지식은 알아야 할 거 아니야? #리캡차책으로 공부하기 2024. 2. 19. 17:09
EBS에서 만들었다고 하면 우선 믿고 보게 되지 않나요? 우리나라에서 EBS는 좋은 양질의 교육 컨텐츠를 만들고 있다고 생각합니다. EBS에서 기획했다길래 "최소한의 코딩 지식"이란 책을 읽지 않을 수 없었습니다. 제목만 보고 프로그래밍 관련 책일 것이라고 생각했는데 전혀 코딩에 대한 것이 아니었습니다.
IT기술의 발전 역사와 사고의 흐름 그리고 현재 사회에 없어서는 안될 소프트웨어적 사고와 코딩 역량의 필요성을 불어넣어줍니다. 또한 인터넷만을 통해 췌장암 진단 키트를 만든 고등학생, 가난한 나라에서 IT 창업 대국으로 세계적인 기업을 탄생시킨 에스토니아 등을 통해 우리 모두 마음만 먹으면 뭐든 할 수 있는 충분한 환경에 놓여있다. 라는 교훈을 주는 책입니다.
유익했던 이야기가 정말 많았지만, 가장 기억에 남고 생각의 관점에 변화를 일으킨 챕터 하나를 소개하려 합니다. 2장의 '10초 리캡차'입니다. 모두들 로봇인지 아닌지 확인하기 위해 이상한 글씨를 보고 올바르게 입력하라는 것을 해본 적이 있으실 겁니다. 자동가입 방지 문자 시험 문제로 이것을 캡차라고 부릅니다. 이를 통해 악의적으로 사용되는 컴퓨터 프로그램인 봇을 차단하여 부당한 이익을 막고 광고물도 막고, 스팸을 보내거나 자동가입을 시도하거나 이메일 주소 및 사용자의 개인정보를 해킹하는 것을 차단하여 이메일 주소를 보호할 수 있습니다. 이 자체로도 의미가 있지 않나요? 하지만 이를 만든 연구원들은 한 단계 더 나아가 생각합니다. 전 세계적으로 매일 2억 개에 이르는 문자열이 입력되는데 이렇게만 사용하기에는 아깝다. 좀 더 인류에 도움될 수 있는 방법은 없을까? 생각하다가 오래된 문서를 복원하는 작업에 캡차를 이용하게 됩니다. 현 시대에는 디지털화가 가속화되어 널리 전세계적으로 더 많은 사람들에게 공유하고 오래 기록될 수 있도록 문서나 책을 디지털화합니다. 이를 위해 OCR이라는 기술을 활용하게 되고 OCR은 문자의 형상을 스캔하여 문자로 변환하는 기술입니다. 하지만 오래된 종이 문서는 색이 바래거나 잉크가 날아가서 글자를 스캔하는데 어려움이 있다는 문제가 있습니다. 출간 50년이 지난 책의 OCR 인식율은 30%에 이른다고 합니다. 따라서 오래된 문서를 인식하기 위해서는 컴퓨터가 아닌 사람이 일일이 파악하게 되는데 워낙 방대한 양이기 때문에 어마어마한 인력과 돈, 시간이 소요됩니다.
OCR이 인식하지 못한 글자를 캡차의 문자열과 함께 제시하며 사용자들에게 맞추라고 문제를 냅니다. 즉, 문자열에 문자는 두 가지 기능으로 구분됩니다. 1) 사용자가 로봇인지 아닌지 구분하기 위한 문자 2) 고문서를 디지털하기 위한 인식 불량 문자. 따라서 로봇인지 아닌지 구분하기 위한 문자만 맞춰도 로봇이 아닌 것으로 판명되어 다음 단계로 넘어갈 수 있습니다. 고문서의 문자를 맞추지 못해도 로봇 판별용 문자열을 올바르게 입력하면 사람으로 간주해 다음 문자도 올바르게 입력했다고 판단하여 넘어가기 때문입니다. 고문서의 문자열은 다수에게 입력을 받은 후 가장 많은 사람이 예측한 문자를 답으로 취득해 디지털화 작업에 사용됩니다. 즉 이를 통해 고문서를 복원하는 대규모 프로젝트에 나도 몰래 동참하고 있는 것이고 인류에 공헌하고 있는 셈입니다. 나의 의견이 보안에 이용되는 것은 기본이며 문서를 복원하는데 반영되고 검색 가능한 정보의 양을 확대하는데 공헌하게 되며 구글 맵의 거리 촬영에 쓰인 표지판이나 간판 등을 인식하는 것에 사용되기도 합니다.
이 이야기를 통해 느낀 아주 감명깊은 문장 두 개가 있습니다.
문장1. 과거 이집트의 피라미드나 파나마 운하 공사처럼 대규모의 인력을 필요로 하는 일을 인터넷 세상에서는 이렇게 간단한 소프트웨어 프로그램 하나로 아주 쉽게 해결하고 있답니다.
: 나도 모르는 사이 내가 인류 발전에 기여했다는 것과 소프트웨어의 가치를 자연스럽게 주입시킴으로써 소프트웨어 프로그램은 정말 중요하고 가치있는 것이라는 생각이 듭니다. 또한 이렇게 빠르고 짧은 시간 내에 원하는 것을 구축할 수 있는 것은 인터넷뿐이라는 생각이 듭니다. 인터넷의 중요성, 집단의 중요성, 소프트웨어적 사고의 중요성
문장2. 캡차 문제를 푸는 데 그냥 버려지는 시간 10초를 어떻게 하면 가치 있는 일에 쓰이게 할 수 있을까 하는 고민. 이것이 인간 중심의 컴퓨터적 사고, 코딩적 사고입니다. 이러한 사고가 오프라인에서는 이루어지기 힘든 기적을 만들어내고 있어요.
: 관점을 조금 다르게 생각해보면 고문서를 디지털화하는 것의 정보 제공의 주체를 사용자에게 넘겨 효율적으로 진행할 수 있게 만든다는 것입니다. 돈도 내가 일해서 버는 것이 아닌 돈이 돈을 벌게 하는 구조가 경제적 자유를 이룬다고 하죠? 플랫폼 사업도 기업이 컨텐츠를 생산해내는 것이 아닌 사람들 스스로가 컨텐츠를 생산해서 기업을 더욱 커지게 만들고 있습니다. 예를 들어, 페이스북, 인스타그램, 당근마켓 등이 있습니다. 기업이 제품을 만들지 않죠. 제품이 만들어질 환경만 제공할뿐입니다. 사용자가 본인의 사진/영상/중고 제품을 업로드 하고 공유합니다. 이렇게 정보 제공의 주체를 소수(내)가 아닌 다수가 되도록 만드는 것이 아주 중요합니다. 이 챕터를 통해 저는 스타트업을 하는 친구의 제품이 생각났습니다. 이 제품을 더욱 키우기 위해서 어떻게 해야할지 너무 좋은 아이디어가 떠올라서 혼자 신이 났네요. ㅎㅎㅎ
→ 책을 읽는 것의 중요성 : 다른 사람의 지식이나 경험을 통해 배운 점을 나에게도 적용함으로써 성장하는 것 + 생각을 전환시키는 것 + 알고 있던 것을 더욱 확실하게 알고 해결 방법까지 확장시키는 것. 저에게 이번 책은 너무 유익하고 좋은 책이었습니다. 추천합니다!
참고 문헌 : 최소한의 코딩지식 (EBS제작팀, 가나출판사)
'책으로 공부하기' 카테고리의 다른 글
여유시간에 즐기는 취미 생활 #사바하 #살인자의 쇼핑몰 (1) 2024.03.08 [비상식적 성공 법칙] 당신의 연 수입을 10배로 늘린다 (0) 2024.03.04 아홉 살에 시작하는 똑똑한 초등 신문 (0) 2024.02.17 [그로스해킹] 고객 유입 성과 확인, 어트리뷰션, Attribution (2-1) (0) 2024.02.08 [그로스해킹] AB테스트 (4) (0) 2024.02.02