이대형(파티게임즈 CEO)
중국 인터넷과의 대화
칠종칠금, 중국 인터넷과 대화하다 (10) 바이두 리옌홍, 클라우드, 빅데이터를 통해 본 중국 인터넷의 미래
2015/06/01 08:31AM
요약
- 빅데이터를 통해 '인사이트'를 도출하고 '인과 관계'나 '상관 관계'를 찾을 수 있음
- 클라우드 컴퓨팅은 PC보다 더욱 많은 데이터를 계산할 수 있는 서비스의 변형 형태임
- 사용자들의 '빅데이터'를 통해 미래를 내다보고 앞으로의 결과를 예상해 볼 수 있음
- 미래에는 '사람'과 '정보'이 아닌 '사람'과 '서비스'를 연결시켜주는 변화를 예측함
이대형: 최근 ‘빅데이터’라는 말을 많이 듣는데 이게 무슨 개념인지 설명해줄 수 있는가?
리옌홍: 빅데이터는 정말 유용한 것이다. PC와 모바일기기의 사용이 늘어남으로써 인류가 만들어내는 데이터의 양이 폭발적으로 증가했다. 그 결과 기하급수적으로 늘어나는 데이터를 분석하고 처리할 만한 기술이 요구되었고 이에 빅데이터가 등장했다. 방대한 규모의 정보를 처리할 수 있는 저장용량과 컴퓨팅파워 및 알고리즘이 크게 개선되었고 많은 인터넷기업들이 이러한 기술발전의 도움을 받아 데이터의 바다에서 이전에는 알 수 없었던 인사이트를 도출하기도 하고 증명해내지 못했던 인과관계나 상관관계를 찾아낼 수도 있게 되었다.
이대형: 데이터의 양이 엄청나게 증가했다고 하는데, 얼마나 증가했는가?
리옌홍: 예를 들면 지난 2년간 발생한 정보량이 인류의 역사가 시작되고 난 이후 1만 년 동안의 정보량과 같다. 또한 계속해서 빨라지고 있는 추세다.
이대형: 앞으로는 500억 개의 스마트 디바이스(smart device)가 데이터를 수집하거나 전송하는 용도로 사용될 것이라고 한다. 클라우드 컴퓨팅은 어떻게 생겨난 것인가?
리옌홍: 클라우드 컴퓨팅은 대량의 자원들 즉, 계산이나 저장, 네트워크, 데이터 등을 가상화시킨 후 종합해 일종의 서비스로 변형시키는 것이다. 언제나 얻을 수 있는 무한한 자원을 가지고 있다고 생각하면 된다. 마치 수도꼭지를 틀면 물이 나오고, 코드를 꼽으면 전기가 나오며, ATM기에서는 돈을 뽑는 것과 같다. 과거 사람들은 데이터를 계산하거나 저장하는 데에 PC의 사용이 충분할 것이라고 생각했지만 오늘날 들어 데이터 양이 점차 증가하고 세분화되며 실시간화될수록 PC로는 충족될 수 없게 되었다. 그래서 반드시 클라우드 컴퓨팅을 사용해야 한다.
이대형: 2009년 신종인플루엔자가 발생하기 대략 몇 달 전에 구글이 세계보건기구에 신종인플루엔자가 발생할 것이라고 알렸다는 기사를 본 적이 있다. 당시 구글은 원인은 몰랐지만 각종 추세를 분석한 결과 알 수 있었다고 한다. 하지만 이를 발견했던 프로그래머들은 ‘어떠한 인과관계 때문인지’에 관해선 모른다고 했다. 이에 대해 어떤 이론가는 “과거에는 ‘인과관계’ 즉, 어떤 원인으로 이런 결과가 나왔는지에 대해 집착했었다면, 앞으로 다가올 빅데이터 시대에는 ‘상관관계’로 바뀔 것”이라고 말한다.
한 예로, 손전등과 에그타르트를 함께 진열하는 월마트를 들 수 있다. 월마트에서는 허리케인이 불어오는 계절이 되면 사람들이 손전등이나 우비와 같은 응급물품들을 구매할 때 에그타르트 또한 먹고 싶어 한다는 사실을 알아냈다. 인과관계로는 ‘허리케인이 불면 사람들은 에그타르트를 먹고 싶어 한다’라는 결과를 도출해낼 수 없다.
하지만 데이터들을 기반으로 한다면 ‘허리케인이 불면 사람들은 에그타르트를 먹고 싶어 한다’라는 현상을 알아내, 허리케인과 에그타르트 간의 상관관계에 관해 분석해낼 수 있는 것이다. 무엇 때문에 이런 결과가 나올 수 있는지 정확히 설명할 수 있는 사람은 아무도 없지만 두 행위(긴급물품을 구매할 때 에그타르트가 땡기는 것)가 동시에 발생한다는 사실은 분명히 알 수 있다. 그래서 월마트는 손전등과 에그타르트를 함께 진열해 놓았다고 한다.
리옌홍: 빅데이터로 새로운 세계를 연구할 수 있는 방식이나 통로를 연 것 같다. 조금 전 구글이 신종인플루엔자를 발견한 사례를 말해주었는데 사실 굉장히 간단하다. 바이두도 마찬가지지만 우리는 검색엔진을 ‘database of intention(검색어들을 데이터베이스화하여 사람들이 원하는 것을 알아낼 수 있음을 의미함) ’이라고 부른다. 당신이 어떤 것에 관해 검색한다는 행위는 곧 그것에 관심을 갖고 있다는 뜻이다. 궁금한 것이 있으면 바이두(검색엔진)를 통해 물어보면 된다. 친구들이나 가족에게 묻기 싫은 것들을 검색엔진을 통해 관련 검색어만 검색해보면 알 수 있다.
만약 어떤 사람이 몸에 이상이 있다고 생각돼 검색엔진을 통해 해당 증상을 검색하는데 특정 지역에서 이런 증상을 검색하는 횟수가 갑자기 높아지게 되면 우리는 일종의 전염병을 예상할 수가 있는 것이다.
이렇게 축적된 많은 데이터를 기반으로 산출해낸 현상 간의 연관성은 과거에 우리가 몰랐던 것일 수도 있고 주의를 기울이지 못했던 것일 수도 있다.
빅데이터를 이용하면 그것들의 연관성을 파악함으로써 결과를 알 수 있게 된다. 그 결과를 가지고 원인을 찾아내는 것이다.
이대형: 2014년 월드컵 때 소프트뱅크, 구글, 바이두가 인공지능 엔진으로 각 시합의 결과를 예측했고, 토너먼트에서 100%의 예측률을 보였다. 이는 빅데이터의 형식이나 예측방식이 점차 정확해지고 있음을 의미한다. 작년 중국의 한 엔지니어가 오스카 시상식에 관하여 영화의 인기 및 소셜네트워크를 통한 평가, 과거 데이터 등을 기반으로 예측한 결과 24개의 수상결과 중 23개를 맞춰냈다.
리옌홍: 빅데이터는 정말 대단하다. 우리가 과거에 생각하지 못했던 것들을 할 수 있다. 한 예로, 금년 수능을 앞두고 우리 팀은 수능 작문 주제를 맞춰보자고 한 적이 있었다. 과거에 출제됐었던 작문 주제, 각 지역성(중국은 지역마다 수능문제가 다름), 예문, 당시의 인기 시사 등을 통해 방향성을 찾았고 4-5개 성의 작문 주제를 맞췄다.
이대형: 빅데이터는 전통적인 뉴스(신문)나 오락 등에 큰 충격을 가져다 주었다. 허핑턴포스트(The Huffington Post)를 예로 들자면, 과거에는 몇십 년이라는 편집자의 경험을 바탕으로 독자의 니즈나 아이템 선정, 기사의 위치 등이 정해졌었으나 이제는 컴퓨터를 통해 모든 작업이 진행되고 있다고 한다.
리옌홍: 맞다. 그런 작업은 당연히 컴퓨터가 더 잘 해낼 수 있다. 만약 당신이 IT 관련기사를 클릭한다면 우리는 당신이 IT에 관심을 갖고 있다는 사실을 파악하게 된다. 그래서 우린 당신이 스크롤바를 내릴 때 더 많은 IT 기사를 제공할 수 있도록 한다. 이는 몇 초 전에 당신이 한 행위가 몇 초 후의 당신에게 영향을 끼친다는 것을 보여주고 있는 것이다.
이대형: 중국은 인구도 많고 유동량도 굉장히 많은 편인데 빅데이터가 중국에 어떤 영향을 가지고 올 것이라고 보는가?
리옌홍: 예전에 원자바오 총리가 바이두에 방문한 적이 있는데, 우리가 음성 검색 지원을 보여주면서 궁금한 걸 말로 물어보면 검색해준다고 했더니 지금 고궁에 사람이 많은지 물어보더라. 우리 기기가 그 중 몇몇 글자는 식별했지만 산출한 결과는 그가 원하던 바가 아니었고, 어떤 특정한 날에 고궁에 사람이 많은지에 대한 자료들이 검색되어 나왔다. 당시 우리는 이런 질문이 있으리라고는 전혀 생각하지도 못했을 뿐만 아니라 그에 관한 검색결과를 알아낼 기술조차 없었다. 나중에 많은 분석을 거쳐 x곳에 자리를 원하는 사람이 많으면 그곳에 사람이 많다는 것을 알아냈다. 그래서 지금 바이두에서는 이화원에 사람이 많은지, 천안문은 어떤 상태인지 검색하면 열에너지 지도로 실시간 상황을 알 수 있게 됐다. 이런 것들 모두 빅데이터를 통해 이루어낸 것이다.
아직까지는 빅데이터의 초기라고 볼 수 있다. 사실 데이터들의 대부분은 목적 없이 발생하고 가치가 없을 때도 있다. 그러나 특정한 것에 근거하여 데이터가 발생할 때 산출될 능력은 엄청난 가치가 있을 것이라고 생각한다. 앞으로 나타날 데이터들은 목적을 갖고 탄생할 것이다.
이대형: 빅데이터니 클라우드니 개념이 소개된 지는 꽤 오래된 편이지만 실제로 활용되기 시작한 것은 불과 몇 년이 지나지 않았는데, 이렇게 큰 변화를 가져오면서 가능성을 보여준다는 점은 정말 대단한 것 같다. 빠르게 변화하는 인터넷시대를 앞서가고 있는 바이두는 매우 흥분될 것 같다.
리옌홍: 물론 기분이 좋을 때도 있지만 괴로울 때도 많다. 언제 새로운 것이 나타날지 모르고 내가 뒤처질지 모르기 때문이다. 세상은 너무 빠르게 변하고 있다. 문자검색을 사용하는 사람들이 여전히 많지만 근래 들어 음성검색이나 이미지검색 이용률이 엄청나게 증가하고 있다. 5년 후에는 50% 이상의 사람들이 문자검색이 아닌 음성이나 이미지검색을 사용할 것 같다. 그리고 10년 뒤쯤에는 사람들 생각을 미리 파악해서 검색할 수 있는 상품이 나오지 않을까?
이대형: 이런 변화의 추세를 알고 충분한 자원을 가지고 노력하고 있는데, 위기감을 느끼는가?
리옌홍: 그렇다. 나는 우리가 더 잘할 수 있다고 생각하는데 항상 충분히 빠르지 못하다고 생각한다. 만일 다른 사람이 우리보다 빨리 새로운 기술을 개발하면 우린 도태될 지도 모른다.
이대형: 바이두, 알리바바, 텐센트를 BAT라고 칭하고 삼국전쟁이라고 부르는데 어떻게 생각하는지? 어떤 방향으로 발전하고 있다고 생각하는가? 그리고 바이두를 어떻게 정의하고 있는가?
리옌홍: 인터넷 산업은 아직까지 빠른 속도로 변화하는 과정에 놓여져 있다고 생각한다. 현재는 상위 기업으로 BAT를 뽑지만 몇 년이 지나면 바뀔 수 있다고 생각한다. 후발주자들에게 아직까지 많은 기회가 있다. BAT 역시 직접적으로 경쟁하는 관계가 아니라 각자의 다른 능력을 가지고 전통 산업이라는 큰 적을 상대하고 있다. 텐센트는 제품이 뛰어나고, 알리바바는 운영이 뛰어나고 바이두는 기술이 뛰어나다.
현재 바이두가 실행하고 있는 영화티켓 공동구매를 예로 든다면, 바이두에서 직접 앱을 검색하거나 영화제목을 검색해보자. 최종적으로 내 주변의 영화관을 검색해줄 뿐만 아니라 할인도 받을 수 있고 심지어는 자리예매까지 가능하다. 이를 통해 영화관의 관객 동원율 즉 효력을 높여주는 것이다. 노래방이나 식당도 마찬가지이다. 효력을 높여줄 수 있는 것들이 굉장히 많다.
BAT는 경쟁자임이 분명하지만 현재는 협력하며 시장을 바꿔가고 있다. 시장의 규모는 굉장히 크다.
이대형: 마지막으로 앞으로의 2년 동안에는 어떤 일이 발생할 것 같은가?
리옌홍: 모바일 인터넷의 중요성이 계속해서 커지고 이는 사람들에게 근본적인 변화를 가져다 줄 수 있을 것으로 보고 있다. 그것은 현재의 인터넷 회사들뿐만 아니라 전통 산업도 변화시킬 것이다. 전통 산업들은 인터넷과 더 긴밀하게 결합해야 하고, 휴대폰을 통해 그들이 원하는 서비스를 얻을 수 있도록 해야 한다.
과거의 검색엔진은 사람과 정보를 연결시켰지만 미래의 검색엔진은 사람과 서비스를 연결시키는 것이 될 것이다. 조금 전 영화관을 예로 말했었는데 그것은 단지 서비스가 아닌 내가 영화를 볼 수 있도록 모든 일을 제공하는 것이다.
사람들이 원하는 것을 제공하기 위해서 이제는 모든 전통 산업이 인터넷을 포용해야 한다.
이대형: 그럼 관점을 바꿔서 다른 질문을 해보겠다. 구글의 경우 빅데이터를 통한 서비스고도화 과정에서 개인정보침해 이슈로 전 세계에서 많은 소송을 당하고 있다. 이전에 구글의 창업자였던 세르게이 브린이 “사용자에게 더욱 유용한 정보를 주기 위해 개인정보를 모으는 것은 사생활 침해가 아니다”라고 발언했다가 언론의 뭇매를 맞기도 했다. 빅데이터와 빅브라더가 연관검색어로 등장할 만큼 데이터활용의 고도화와 사생활 침해를 연결해서 비판하는 사람들이 많은데, 당신의 생각은 어떠한가?
리옌홍: 과거 등소평 주석은 중국의 경제개방 당시에 “흰 고양이든, 검은 고양이든 쥐만 잘 잡으면 된다”라는 이야기를 했다. 중국인들의 합리주의와 실리주의를 잘 표현한 문장이라고 생각한다. 사실 중국에서 프라이버시의 침해와 같은 감정논리는 성장논리에 막혀 서양을 비롯한 다른 선진국들에 비해 덜 중요하게 다뤄지는 게 사실이다. 다른 선진국들에서는 이러한 문제에 어떻게 대처하고 있는가?
이대형: 개인정보 침해 이슈는 여전히 민감하지만 많은 서비스 들이 SNS기반으로 변하면서 또 다른 양상을 보이고 있다. 과거에 구글이 기계적으로 이메일에 사용된 단어를 사전화하여 타겟광고를 하는 것에 대해서는 굉장히 민감하게 반응했던 유저들도 페이스북에서 더 민감한 개인정보를 활용해 타겟광고를 하는 것에 대해서는 너그러운 경향을 보인다. 구글메일에 영화에 대한 이야기를 친구들과 나누면 영화 광고가 뜨는 것을 보면 기분이 나쁘지만 페이스북에서 영화에 대해 Like버튼을 토대로 타임라인에 영화를 추천해주면 정보로 받아들이기도 한다. 인터넷 사용자들이 서비스 경험이 축적되면서 자신들이 제공한 개인정보가 스스로 제공했음을 인지하고 있고, 어떠한 방식으로 서비스에 활용되는지 체감적으로 알게 된 이유가 큰 것 같다.
ⓒ 두나무 주식회사 & insight.stockplus.com , 무단전재 및 재배포 금지
이대형(파티게임즈 CEO) 의 다른 글 보기 >>