구글 뉴스 알고리즘 : Inside the Google News algorithm


[from Computer World

구글뉴스 개발자인 Krishna Bharat이 밝힌 구글 뉴스 알고리즘.



  1. Generally, articles are ranked based on originality, freshness, quality, expertise of source and whether a lot of other sources around the Web are pointing to a particular article.
    기본적으로, 독창성, 속보성, 전문지여부, 기사의 품질, 해당 기사의 인용여부에 의거하여, 기사의 랭킹이 좌우됨.

  2. Volume and originality of content produced consistently about a topic.
    특정 분야에 대하여 꾸준하게 새로운 기사를 생산하는지. 예를 들어 ESPN은 스포츠 분야의 기사에서 높은 가중치를 얻겠지만, 경제 분야에선 낮은 가중치를 얻게 됨.

  3. Links around the Web. Do a lot of other sites link back to that source?
    해당 기사의 인용여부, 페이지 랭크. 단순히 양뿐만 아니라 “링크의 질”도 고려하여야 함 

  4. What users do in response to links to that source on Google News. Are some sources’ links clicked on more often than others?
    구글 뉴스에서 해당 출처(언론사)의 기사 링크를 자주 클릭하는지.

이와 더불어, 구글뉴스 뉴스검색결과는 relevance, page placement (have editors put a story on a site’s home page or just buried it somewhere deep inside the site?), freshness and — not sure this is a word, sorry — localness to the user. 를 고려함.

이외에 패거리 저널리즘(herd journalism)의 부작용을 방지하고, 다수의 관심과 거리가 있는 소수의 관심분야에 대한 배려를 위하여 “Spotlight” 섹션을 오픈.


 

답글 남기기