중앙데일리

빅 데이터로 재미 좀 보셨습니까?

Aug 10,2019
돌이켜보면 빅 데이터란 말이 유행하기 시작한 지도 꽤 오래 되었다. 사실 늘 데이터를 다루며 그것으로 가치를 창출하는 작업을 오랫동안 해 온 사람들에게는 그건 애초부터 적절하지 않은 표현이었다. 데이터를 주 기반으로 하는 구글이나 아마존 같은 거대기업들은 그런 말을 쓰지도 않는다.

우선 그 “빅”이라는 단어에 많은 오해의 소지가 있다. 처음 빅 데이터란 말이 쓰이기 시작했을 때에는 많은 이들이 그것을 3V, 즉 Volume(크기), Velocity(속도), Variety(다양성)로 정의하곤 했는데, 그런 기술적 정의도 다양하고 방대한 양의 데이터가 빨리 돌아 다니기만 하면 가치가 창출된다는 오해를 낳아서 바람직하지 않다. 그 광고적 표현을 만들어낸 소프트웨어 회사들의 의도도 “이제는 아주 방대한 데이터도 처리할 수 있다”이지 “데이터는 커야만 한다”가 아니었다.

데이터의 크기만 강조하는 것은 마치 따뜻한 밥 한 공기를 원하는 배고픈 사람 앞에서 대한민국 1년 쌀 수확량이 얼마냐는 통계나 나열하는 형국이다. 실상 데이터는 작아질수록 사용자에게 가치가 있는 법이다. 예를 들어 우리가 매일 접하는 일기예보도 엄청난 양의 데이터를 분석한 결과물이다. 사용자들이 원하는 것은 “내일 오후에 비가 올 확률은 70%입니다”같이 작으면서도 쓸모 있는 정보이지 그들은 결코 수집된 데이터 전체를 원하는 것도 아니고 미래를 예측하는 모델링 과정을 알고 싶어하는 것도 아니다.

정보 공급자 입장에서 보면 빅 데이터를 취미로 하는 것이 아니라면 연관된 모든 노력의 결과로 매출향상이나 비용절감 등 구체적인 성과가 있어야 거기에 대한 지속적 투자가 이어지게 된다. 그냥 남들이 하니까 프로젝트의 방향도 제대로 정해지지 않은 상태에서 뛰어들면 본전도 못 건지는 경우가 대부분이다. 즉 데이터 수집이나 분석은 사업목적을 달성하는데 필요해서 하는 것이지 데이터를 오래 가지고 놀다 보면 무슨 대답이 저절로 나오는 게 아니란 말이다.


내가 한 영작

The word “big” can be misleading in many ways. When the term was first used, “big” was added to differentiate in terms of the volume, velocity and variety in data discovery, analytics and application from general data. But that technical definition ①also can be misunderstood ②as that data needs to be ③in bulk, diversity and speedy movement to be valuable. Software companies did not mean to emphasize that data needs to be “big” or that they were capable of processing information regardless of the bulky size.

But that technical definition ①also can be misunderstood ②as that data needs to be ③in bulk, diversity and speedy movement to be valuable.


①also can be → can also be 조동사 뒤 일반 동사 앞에 빈도부사가 오는 것이 일반적

②as that data needs… → in that data needs… data는 복수명사 이므로 지시사를 사용할 경우 those 가 와야 함; 전치사+that절의 경우 전치사는 생략하나 in that은 예외

③in bulk, diversity and speedy movement …. → in bulk and be diverse … speedy movement 는 문맥상 불필요한 단어이므로 생략, bulky는 주로 겉으로 드러난 크기를 나타냄, 상태를 나타내는 in bulk가 적합한 문맥; 상태 in diversity 로 표현할 필요가 없으므로 형용사 diverse 사용.


After proofreading

The word “big” can be misleading in many ways. When the term was first used, “big” was added to differentiate in terms of the volume, velocity and variety in data discovery, analytics and application from general data. But that technical definition ①can also be misunderstood ②in that data needs to be ③in bulk and be diverse to be valuable. Software companies did not mean to emphasize that data needs to be “big” or that they were capable of processing information regardless of the bulky size.


광산에서 금을 캐었다고 금시계가 저절로 생기는 게 아니듯이 데이터도 가공이 되어야 가치를 지니게 된다. 많은 조직들은 데이터를 수집하고 그 정보를 그대로 사용자에게 전달하는 데에 대부분의 시간과 노력을 들이고 있는데, 정작 그것은 긴 데이터 여정의 시작과 끝일 뿐이다. 그 중간 과정으로 데이터를 수정, 재구성하고 예측적 분석으로 빈 곳을 메워주는 보완작업까지 마쳐야 비로소 쓸모가 있는 정보가 만들어지는 것이다.

아무도 쓰지 않는 데이터는 분명 쓸모 없는 것이니 사용자의 관점에서 유용한 정보를 정의해 보겠다. 첫째, 그것은 전문지식 없이도 쉽게 이해할 수 있는 것이며, 둘째, 산더미 같은 데이터가 아니라 즉시 사용가능 한 질문에 대한 작은 답들이고, 셋째, 일관되게 정확하여 늘 효과적으로 쓸 수 있는 도구이며, 넷째, 한정된 경우에만 적용되는 것이 아니라 대부분의 경우에 도움이 되는 것, 그리고 다섯째, 사용자가 선호하는 채널과 기기를 통해 언제 어디서나 접근 가능한 것이어야 한다. 그리고 이런 조건들은 그 “빅”이란 단어와는 별 상관이 없다.

데이터로 경제적 가치를 창출하는 일을 30년 넘게 도와온 사람으로서 요즘 자주 하는 질문은 “빅 데이터로 재미 좀 보셨습니까?”이다. 엄청난 양의 데이터를 수집, 가공하여 사용자에게 도움을 주는 과정은 많은 노력과 투자를 필요로 하며, 모든 사업이 그렇듯이 분명한 목적을 가지고 시작해야 한다. 명확하지 않은 질문에는 답도 없는 법이기 때문이다.

유혁 윌로우 데이타 스트리티지 대표


내가 한 영작

Gold-mining does not immediately ④make a commercial value like a gold watch. Data too must be processed to add value. Many organizations are devoted to collecting data and delivering it to the users. But that’s just a small part of data processing. ⑤There must be a work to amend, reorganize or add analytical value to make the data meaningful.
So what is useful data? First, it must be simple and easy to understand. Second, the user ⑥does not want the full book, but concise answers to questions. Third, the information must be consistently correct and useful. Fourth, the information must be applicable broadly and not in restricted cases. Fifth, the information must be available and accessible whenever the user ⑦seeks through a certain platform or device. ⑧All these functions hardly are connected to “bigness.”


④make a commercial … → produce commercial … value가 여기서는 추상적인 의미로 쓰였으므로a 생략; make는 제조의 의미가 강함으로 produce가 적절

⑤There must be a work to amend, reorganize or add analytical value to make the data meaningful.
→불필요한 문장이므로 생략

⑥does not want the full book, but concise answers to questions. → needs concise answers to questions. full book은 문맥에 맞지 않으므로 삭제

⑦seeks through a certain platform or device. →seeks it. 간결하게 대명사 it 으로

⑧All these functions hardly are connected to “bigness.” → 불필요한 문장이므로 생략


After proofreading

Gold-mining does not immediately ④produce commercial value like a gold watch. Data, too, must be processed to add value. Many organizations are devoted to collecting data and delivering it to users. But that’s just a small part of data processing. ⑤
So what is useful data? First, it must be simple and easy to understand. Second, the user ⑥needs concise answers to questions. Third, the information must be consistently correct and useful. Fourth, the information must be applicable broadly and not in restricted cases. Fifth, the information must be available and accessible whenever the user ⑦seeks it. ⑧



dictionary dictionary | 프린트 메일로보내기 내블로그에 저장