제목이 너무 원색적인가요? 하지만 충분히 가능성이 있는 이야기라고 합니다.

Google에서 제공하는 음성검색 서비스인 GOOG-411이 있는데, 전화를 걸어서 자신이 원하는 것을 음성으로 말하면 검색된 업체(기관) 등에 전화를 걸 수 있는 서비스입니다. 예를 들어 피자라고 음성으로 이야기하면 가장 가까운 피자 가게로 무료로 연결해 주는 서비스입니다. (지난 번에 본 블로그에서 소개한 적이 있는데 자세한 내용은 여기를 참고하시기 바랍니다.) 이번에 이 서비스에 "Map it"이라는 기능이 추가되었는데 전화 통화 중에 Map it 이라고 이야기하면 요청한 정보와 관련된 지도 정보를 핸드폰으로 보내준다고 하는군요. 정말 서비스 진화는 끝없이 진행되는 듯 합니다.


오늘 이야기하려는 주제는 "왜 Google이 GOOG-411 서비스를 공짜로 제공하는가"에 대한 것입니다. 이 서비스는 이용자에게 공짜로 제공되지만, 서비스를 제공하는 Google에게는 적잖은 비용이 듭니다. 접속번호가 800(우리나라의 080)이므로 접속료도 부담해야 하고, 검색된 업체에 전화를 연결하는 비용도 들고, 이용자에게 SMS를 보내는 비용까지 고스란히 구글이 부담하고 있습니다. 제 아무리 현금이 많은 Google이라고 할지라도 이렇게 비용이 많이 드는 서비스를 공짜로 제공하는 것에는 다른 속셈이 있을거라고 몇몇 사람들은 생각하고 있습니다.


Google이 원하는 것은 바로 서비스 이용자의 목소리 샘플입니다. GOOG-411 서비스는 음성인식회사인 Nuance에서 일했던 몇몇 엔지니어가 Google에 입사해서 런칭시킨 것으로 알려져 있으며, 음성인식에 필요한 음원 데이터를 이 회사에서 라이센싱하지 않고 Google이 독자적으로 수집하고 있는 것으로 추측됩니다.

이와 관련해서 현재 음성검색 서비스의 최강자인 TellMe의 CEO인 Mike McCue는 2007년 2월(이 때는 마이크로소프트가 TellMe를 인수하기 전임)에 아래와 같은 이야기를 했습니다.


“…our search index is better than Google's right now. The grammars that we have -- we do about 10 billion speech utterances a year. So what we are able to do is make the speech recognition system smarter and smarter. And that is something that Google can't get until they get that similar kind of traffic. How are they going to get that traffic? It's a chicken-and-egg problem.”


음성인식의 성공율을 높이기 위해서는 천문학적인 목소리 샘플이 필요한데, 그 당시 Google이 보유하고 있는 데이터량은 TellMe와 비교할 수 없었다라고 밝히고 있는 것입니다. 즉, 비용이 많이 드는 GOOG-411 서비스를 공짜로 제공하는 것은 목소리 샘플을 많이 확보하기 위한 Google의 전략이라는 이야기인데, Google의 공짜 서비스를 이용하는 댓가로 내 목소리를 제공하고 있다는 이야기가 되는 것이죠.. 이 서비스의 개인보호정책을 보면 다음과 같은 문구가 있는데, Google의 의도를 간파하고 본다면 기분이 찜찜합니다.


We also collect and store a copy of the voice commands you make to the service, so we can audit, evaluate, and improve the voice recognition capabilities of the service.”


10개의 발성(Utterance : 번역이 맞는지 모르겠네요)을 모으기 위해서 약 800만불이 소요되고 Tellme가 이야기하는 100억개를 모으기 위해서는 8천만불이 소요된다는 추정이 가능한데, 현재 Google은 "access to all the world's information"을 가능케 하기 위해서 음성검색이라는 것에 막대한 투자를 하고 있다는 것입니다. 물론 우리가 기꺼이 제공한 목소리를 통해서 말이죠. 좀 끔찍하군요.. 영어권을 대상으로 한 것이라.. 조금 안심해도 되겠죠..


GigaOM에서는 Google의 GrandCentral 인수에 대해 GOOG-411과 같은 우려를 나타내고 있습니다. GrandCentral은 통합음성사서함 서비스도 제공하는데, 거기에 남겨진 음성에 대해서도 Google이 샘플링을 하지 않겠느냐는 것인데, 개인적으로 과도한 우려로 보이는데.. 여러분 생각은 어떠신가요?


보너스로 아래 동영상도 감상해 보세요. 인어공주인데.. 인어공주가 사랑을 위해 악마에게 자신의 목소리를 준다는 내용입니다. 도대체 Google에게 우리 목소리를 제공하는 것은 무엇을 위한 것일까요? 전세계의 보편적인 검색을 위해서라고 생각하죠..뭐...


 



이 글에 대한 의견을 페이스북 댓글로 남겨주세요!!!

  1. Favicon of http://fafagel.com BlogIcon 아도니스.
    2007.07.04 08:58

    MS가 한참전에 텔미 네트웍스를 인수했는데 이 부분에서도 또 두마리 공룡이 충돌하는군요. 아!! 전 왜 싸움구경이 그리 재밌을까요? 저들이 치고박고 싸우다가(경쟁) 흘린 피는 대지(시장)를 비옥하게 하니 소비자 입장에서야 더더욱 좋지만 왠지 내셔널 지오그래픽에서 방영한 티라노와 용의 싸움처럼 양패구상이 되지 않을까 하는 생각도 듭니다.