중앙데일리

A.I. Is Harder Than You Think

인공지능 기술에 대해 다시 생각해야 할 때

June 02,2018
By Gary Marcus and Ernest Davis
MAY.18, 2018


The field of artificial intelligence doesn’t lack for ambition. In January, Google’s chief executive, Sundar Pichai, claimed in an interview that A.I. “is more profound than, I dunno, electricity or fire.”

인공지능 분야의 야망은 끝이 없습니다. 지난 1월 한 인터뷰에서 순다 피차이 구글 최고경영자는 “인공지능은 전기나 불보다 심오하다.”라고 말했습니다.


Day-to-day developments, though, are more mundane. Last week, Mr. Pichai stood onstage in front of a cheering audience and proudly showed a video in which a new Google program, Google Duplex, made a phone call and scheduled a hair salon appointment. The program performed those tasks well enough that a human at the other end of the call didn’t suspect she was talking to a computer.

그렇지만 인공지능을 개발하는 일상은 평범하기만 합니다. 지난주 피차이는 환호하는 관중 앞에서 구글의 새 프로그램 구글 듀플렉스가 미용실에 전화를 걸어 예약하는 영상을 선보였습니다. 전화를 받은 사람이 컴퓨터와 대화한다고 생각하지 못할 정도로 듀플렉스는 전화 업무를 잘 해냈습니다.


Assuming the demonstration is legitimate, that’s an impressive (if somewhat creepy) accomplishment. But Google Duplex is not the advance toward meaningful A.I. that many people seem to think.

이 시연이 속임 없는 사실이라면 (조금 섬뜩하지만) 인상적인 성과입니다. 하지만 구글 듀플렉스는 사람들이 생각하는 것처럼 의미 있는 인공지능의 발전은 아닙니다.


If you read Google’s public statement about Google Duplex, you’ll discover that the initial scope of the project is surprisingly limited. It encompasses just three tasks: helping users “make restaurant reservations, schedule hair salon appointments, and get holiday hours.”

구글 듀플렉스에 대한 공개 보고서를 읽어보면 프로젝트의 초기 범위는 놀랄 만큼 제한되어 있음을 알 수 있습니다. 프로젝트는 단 세 가지 과제만 포함하고 있습니다: “레스토랑 예약하기, 미용실 예약하기, 공휴일의 영업시간 확인하기.”


Schedule hair salon appointments? The dream of artificial intelligence was supposed to be grander than this — to help revolutionize medicine, say, or to produce trustworthy robot helpers for the home.

미용실 예약하기? 우리는 이보다 더 큰, 예를 들면 의학 기술의 수준을 한 단계 끌어올리거나 신뢰할 수 있는 가사 도우미 로봇을 만드는 일 등을 가능하게 하는 인공지능을 꿈꿨습니다.


The reason Google Duplex is so narrow in scope isn’t that it represents a small but important first step toward such goals. The reason is that the field of A.I. doesn’t yet have a clue how to do any better.

구글 듀플렉스 프로젝트의 범위를 이렇게 제한한 이유는 원대한 목표를 향한 작지만 중요한 첫걸음을 상징적으로 보여주고자 했기 때문이 아닙니다. 그저 아직은 인공지능 분야가 더 복잡한 과제를 제대로 처리할 방법을 모르기 때문입니다.


As Google concedes, the trick to making Google Duplex work was to limit it to “closed domains,” or highly constrained types of data (like conversations about making hair salon appointments), “which are narrow enough to explore extensively.” Google Duplex can have a human-sounding conversation only “after being deeply trained in such domains.” Open-ended conversation on a wide range of topics is nowhere in sight.

구글 듀플렉스가 제대로 작동할 수 있었던 비결은 구글이 인정한 대로 널리 연구할 수 있는 “닫힌 분야”와 매우 제한된 종류의 데이터로 범위를 정했기 때문입니다. 미용실에 전화해 예약하는 대화가 정확히 거기에 해당하죠. 구글 듀플렉스는 그런 좁은 분야에 대한 상당한 훈련을 받은 다음에야 사람이 말하는 듯한 대화를 할 수 있습니다. 광범위한 주제를 아우르는 열린 대화는 아직 요원합니다.


The limitations of Google Duplex are not just a result of its being announced prematurely and with too much fanfare; they are also a vivid reminder that genuine A.I. is far beyond the field’s current capabilities, even at a company with perhaps the largest collection of A.I. researchers in the world, vast amounts of computing power and enormous quantities of data.

구글 듀플렉스가 아직 설익은 기술을 섣불리 발표한 것도 아니고, 아직 부족한 기술에 사람들이 지나치게 열광한 것도 아닙니다. 구글은 분명 세계에서 가장 많은 인공지능 연구원을 보유하고 방대한 데이터와 엄청난 전산 처리 능력을 갖추고 있습니다. 그런 구글조차도 현재의 능력으로 진정한 의미의 인공지능을 구현할 수 없다는 것이 오히려 이번 듀플렉스 발표를 통해 생생하게 드러난 겁니다.


The crux of the problem is that the field of artificial intelligence has not come to grips with the infinite complexity of language. Just as you can make infinitely many arithmetic equations by combining a few mathematical symbols and following a small set of rules, you can make infinitely many sentences by combining a modest set of words and a modest set of rules. A genuine, human-level A.I. will need to be able to cope with all of those possible sentences, not just a small fragment of them.

이 문제의 핵심은 인공지능 분야가 언어의 무한한 복잡성을 이해하지 못한다는 사실입니다. 몇 가지 규칙에 따라 소수의 수학 기호를 조합함으로써 무한한 수학 방정식을 만들어 낼 수 있듯이, 적당한 규칙과 적당한 단어들을 조합하여 무한하게 많은 수의 문장을 만들어낼 수 있습니다. 진정한 인간 수준의 인공지능은 문장 몇 가지가 아니라 가능한 조합의 모든 문장을 다룰 수 있어야 합니다.


The narrower the scope of a conversation, the easier it is to have. If your interlocutor is more or less following a script, it is not hard to build a computer program that, with the help of simple phrase-book-like templates, can recognize a few variations on a theme. (“What time does your establishment close?” “I would like a reservation for four people at 7 p.m.”) But mastering a Berlitz phrase book doesn’t make you a fluent speaker of a foreign language. Sooner or later the non sequiturs start flowing.

대화의 범위가 제한될수록 인공지능이 이를 학습하기는 쉬워집니다. 대화 참여자가 스크립트대로 말할 경우, 회화책 같은 단순한 템플릿을 사용해서 주제의 변화를 인식하는 컴퓨터 프로그램을 만들기는 어렵지 않습니다. (“가게 문을 몇 시에 닫으세요?” “저녁 7시에 4명 예약하고 싶은데요.”) 그러나 유명 회화책 한 권을 통달했다고 외국어를 유창하게 말할 수 있는 것이 아니듯, 인공 지능의 대화에는 곧 동문서답이 난무하게 될 것입니다.


Even in a closed domain like restaurant reservations, unusual circumstances are bound to come up. (“Unfortunately, we are redecorating the restaurant that week.”) A good computer programmer can dodge many of these bullets by inducing an interlocutor to rephrase. (“I’m sorry, did you say you were closed that week?”) In short stylized conversations, that may suffice. But in open-ended conversations about complex issues, such hedges will eventually get irritating, if not outright baffling.

레스토랑 예약 같은 제한된 범위에서도 예상하지 못한 시나리오가 발생할 수 있습니다. (“죄송합니다. 저희 레스토랑이 그 주에 내부 공사를 합니다.”라고 나오면 어떻게 반응할까요?) 좋은 컴퓨터 프로그래머라면 대화 참여자가 다시 말하게 유도하여 이런 상황을 가능한 모면할 수 있게 디자인했을 겁니다. 일단 “죄송합니다. 그 주에 문을 닫는다고 말씀하셨나요?” 정도로 짧은 대화는 충분히 넘길 수 있습니다. 그러나 심도 있는 주제로 자유로운 대화를 나눌 때는 그런 얼버무림이 결과적으로 전혀 앞뒤 맥락이 맞지 않는 짜증 나는 대화로 끝날 수도 있습니다.


To be fair, Google Duplex doesn’t literally use phrase-book-like templates. It uses “machine learning” techniques to extract a range of possible phrases drawn from an enormous data set of recordings of human conversations. But the basic problem remains the same: No matter how much data you have and how many patterns you discern, your data will never match the creativity of human beings or the fluidity of the real world. The universe of possible sentences is too complex. There is no end to the variety of life — or to the ways in which we can talk about that variety.

공정하게 말하면 구글 듀플렉스는 회화집 같은 템플릿을 사실 사용하지 않았습니다. 구글 듀플렉스는 머신러닝 기술을 사용하여 인간의 대화를 녹음한 방대한 양의 데이터에서 대화 가능한 문장들을 추출했습니다. 그러나 기본적인 문제는 달라지지 않습니다. 얼마나 많은 수의 데이터를 보유하고, 얼마나 많은 패턴을 구분할 수 있는지와 상관없이, 데이터는 결코 인간의 창의력이나 현실 세계의 가변성에 견줄 수 없습니다. 가능한 문장의 세계는 너무나 복잡합니다. 삶의 다양성은 끝이 없고 인간이 그 다양성에 대해 이야기할 수 있는 방법도 끝이 없는 것처럼 말이죠.


So what should the field of artificial intelligence do instead? Once upon a time, before the fashionable rise of machine learning and “big data,” A.I. researchers tried to understand how complex knowledge could be encoded and processed in computers. This project, known as knowledge engineering, aimed not to create programs that would detect statistical patterns in huge data sets but to formalize, in a system of rules, the fundamental elements of human understanding, so that those rules could be applied in computer programs. Rather than merely imitating the results of our thinking, machines would actually share some of our core cognitive abilities.

그렇다면 인공지능 분야는 대신 무엇을 해야 할까요? 머신러닝과 ‘빅데이터’가 유행하기 전 인공지능 연구원들은 컴퓨터가 어떻게 복잡한 지식을 암호화하고 처리할 수 있는지 파악하고자 노력했습니다. ‘지식 엔지니어링 프로젝트’로 알려진 이 프로젝트는 거대한 데이터에서 통계적 패턴을 감지하는 프로그램을 만들려고 한 것이 아니라, 규칙의 체계 속에서 인간 이해의 근본적인 요소를 정형화하여 컴퓨터 프로그램에 적용하려는 목적이 있었습니다. 인간 생각의 결과를 단순히 모방하는 데서 나아가 기계가 실제로 인간의 인식 능력의 핵심을 함께 공유할 수 있도록 말입니다.


That job proved difficult and was never finished. But “difficult and unfinished” doesn’t mean misguided. A.I. researchers need to return to that project sooner rather than later, ideally enlisting the help of cognitive psychologists who study the question of how human cognition manages to be endlessly flexible.

그 프로젝트는 실현이 어렵다고 밝혀지며 중단되었습니다. 그러나 “어렵고 미완성”이라고 해서 결코 방향이 잘못됐다는 뜻은 아닙니다. 인공지능 연구원들은 언젠가는 그 프로젝트로 돌아가야 할 것입니다. 인간의 의식이 어떻게 끝없이 유연할 수 있는지를 연구하는 인지 심리학자들의 도움을 받으면 좋을 것입니다.


Today’s dominant approach to A.I. has not worked out. Yes, some remarkable applications have been built from it, including Google Translate and Google Duplex. But the limitations of these applications as a form of intelligence should be a wake-up call. If machine learning and big data can’t get us any further than a restaurant reservation, even in the hands of the world’s most capable A.I. company, it is time to reconsider that strategy.

오늘날 인공지능에 대한 주된 접근법은 효과가 없었습니다. 물론, 구글 번역기나 구글 듀플렉스같이 주목할 만한 AI 기반 프로그램이 탄생한 건 대단한 성과입니다. 그러나 지능의 한 형태로 보았을 때 프로그램의 한계는 사람들의 주의를 촉구합니다. 머신러닝과 빅데이터로, 세계에서 가장 유능한 인공지능 회사조차 레스토랑 예약하기 이상의 성과를 내지 못한다면, 어쩌면 지금이 인공지능에 대한 우리의 전략을 다시 생각해야 할 때인지도 모릅니다.


한글 번역 전문은 newspeppermint.com에서 읽으실 수 있습니다.
www.nytimes.com


dictionary dictionary | 프린트 메일로보내기 내블로그에 저장