사용자 삽입 이미지

또 새로운 뉴스 사이트가 등장할 모양입니다.

이번엔 RWW의 표현을 빌리자면 ‘협력적 뉴스 필터링’ 사이트인 social|median입니다. 일자리 검색 엔진 사이트인 jobster의 CEO였던 Jason Goldberg가 지난해 12월 사표를 내고 두 달 전 론칭한 뉴스 사이트입니다. 지금은 알파 버전 단계이고 브라인딩 테스트를 진행중입니다.

social|median는 어떤 뉴스 사이트인가

이 뉴스사이트 모델의 특징과 개념은 “사용자의 피드백에 재빨리 반복적으로 반응하고 빨리 뉴스를 서핑할 수 있도록 한다”는 말로 요약된다고 합니다. Jason Goldberg는 헬스장에서 러닝머신을 타고 있는데 50명 모두가 CNN 헤드라인 뉴스 패키지를 30분 동안 시청하는 상황을 보면서 영감을 얻게 됐다고 합니다. 서로 다른 관심사를 지닌 50명이 어떻게 같은 뉴스를 보고 있지 뭐 이런 생각을 하며  뉴스 네트워크란 개념을 떠올리게 된 게 아닌가 싶더군요.

어떻게 운영되나

social|median은 ‘뉴스 네트워크’를 지향한다고 합니다. 이 개념이 약간 모호할 텐데요. 지금부터 RWW의 포스트를 토대로 간략하게 설명을 드려보겠습니다.

일단 뉴스 네트워크를 누구나 만들 수 있고 또 누구나 참여할 수 있습니다. 이 뉴스 사이트는 스폰지처럼 뉴스를 빨아들입니다.

한번 이 네트워크가 만들어지면 사용자는 토픽과 소스 - 네트워크가 주시하려 하는 - 를 추가하기 시작합니다. Social|median는 사용자에 의해 정의된 토픽에 맞는 뉴스 사이트나 블로그 등 웹을 검색하고, 사용자에게 추가할 소스를 제안하게 됩니다.

네트워크 멤버들은 어떤 소스를 Social|median에서 탭으로 유지할지 어떤 토픽에 스토리를 매칭시켜야 할지 등을 제어하게 된다고 합니다. 그리고 각 소스(뉴스)나 토픽에 대해 업&다운 식의 voting을 하게 되면 알고리즘이 네트워크의 입맛에 맞게 훈련된다고 합니다.

뉴스의 자동 피딩 시스템뿐만 아니라 사용자는 북마크사이트를 통해 스토리를 제출하는 옵션을 가질 수도 있습니다. Goldberg는 “사용자가 입력한 관련 뉴스는 통상적으로 사이트의 대부분 네트워크에서 상위에 랭크 된다”고 얘기를 했다는군요.

이 사이트의 뉴스 페이지는 ‘인기 | 최신’으로 구성된다고 합니다. 최신 뉴스는 시간과 관련도, 소스 중요도에 따라 배열되고, 인기 뉴스는 댓글이나 voting, emailing과 같이 사용자와의 상호작용(interaction)에 따라 배치됩니다.

기계적으로 번역하다 보니 제대로 쉽게 설명을 드리지는 못했네요.

협력적 필터링이란?

이 뉴스 사이트를 이해하기 위해선 협력적 필터링이란 개념을 먼저 이해할 필요가 있습니다. Collaborative Filtering(이하 CF) 방식은 관련 기사나 관련 상품을 추천하는데 자주 활용되는 데이터 마이닝 기법입니다. 이 모델이 적용된 대표적인 사이트라면 아마존의 추천 서적 서비스를 들 수 있습니다.

Collaborative Filtering은 사용자의 이전 행위 기록이나 설문조사 결과를 분석해 사용자가 선호할 만한 결과물(뉴스나 상품)을 추천해주는 시스템이라고 보시면 될 것 같네요. 그래서 전자상거래 사이트, 쇼핑몰 등에 많이 활용되고 있는 데이터 마이닝 추천시스템 모델입니다.

Jason Goldberg는 이 모델을 뉴스 사이트에 적용시키는 실험에 도전한 것입니다. 동작원리도 이 모델에 기반한 것으로 보입니다. 사용자가 네트워크를 생선하고 이후 뉴스를 제출하거나 추천하거나 댓글을 달거나, 이메일한 행위를 토대로 이 사용자의 선호를 알고리즘이 분석해내죠.

이를 바탕으로 알고리즘은 사용자에게 관련 소스를 제안하게 됩니다. 네트워크 전체를 하나의 사용자라고 가정했을 때 알고리즘이 분석할 메타 데이터가 많아지기 때문에 누적될수록 훨씬 더 정확한 뉴스 결과물들을 내놓게 되죠. 뉴스 편집도 이러한 알고리즘에 따라 이뤄지게 되는 것으로 생각됩니다. 한마디로 말하면 사용자 맞춤형 뉴스인 셈입니다.

현재 CF 모델을 적용한 뉴스 사이트는 CoFE(http://eecs.oregonstate.edu/iis/CoFE//) 정도를 들 수 있습니다. 지금은 죽어버린 듯 보이는.

참고로 네이버는 또 다른 데이터 마이닝 기법인 뉴스 클러스터링 모델을 적용해 뉴스 검색 서비스를 하고 있습니다. 최근 논문을 찾아보니 CF에 클러스터링 모델을 결합보완시켜 결과물의 만족도를 높이는 실험도 하고 있다던데. 정확히 이 분야의 흐름에 대해서는 문외한이라 더 이상 언급하기는 어려울 것 같습니다.

여하튼, CF 모델을 적용한 뉴스 사이트인 social|median이 얼른 알파 테스트를 끝내고 베일을 벗기를 기대합니다. 뉴스 사이트 자동 편집의 새 장을 열어젖히게 될지 아니면 ‘무모한 도전’으로 기억에서 잊혀지게 될지 자못 궁금해지네요.

그런데 왜 한국에선 이런 모델들이 자주 등장하지 않을까요?
Posted by 몽양부활

댓글을 달아 주세요

  1. Favicon of http://heavenmovs.net/big/cock2cock-frottage BlogIcon cock2cock frottage 2008.05.23 04:28 신고  댓글주소  수정/삭제  댓글쓰기

    걸출한 뉴스!! 종류 블로그!