close

小薑雜談:維基百科的六度分離

六度分離理論,之前在三月的文章中 曾經提過。當時是說在 MSN 中,最多只要透過 6.6 層的關系,就可以連繫到世界上任何一個 MSN 用戶。其實只要有一個足夠大的群體,群體間又相互有連結,都可以套用小世界理論,試著去分析。一位叫做 Stephen Dolan 的強人就想到可以把這個想法推到 Wikipedia 上一試 -- 英文版的 Wikipedia 有 246 萬多篇的文章,文章跟文章之間又都有連結,正好來實驗從一篇文章到另一篇文章須要經過多少個連結

Stephen 的資料取得於 3/3/2008,當時的 Wikipedia 資料庫一共有 2301486 篇文章,文章與文章之間一共有 55550003 個連結。並不是所有的文章間都是相連的 -- 最大的一組互連文章群是 2111480 篇文章,佔總文章數的 91% 強,但仍然有 9% 左右的 Wikipedia 文章是孤島 -- 沒有連出、連入文章,或是幾篇文章間自相互連,形成獨立在主群體之外的小文章群。在 Stephen 的資料裡,最大的小文章群不超過三篇文章。意外的,(或是不意外的,看你怎麼看這件事),Wikipedia 小世界的中心,是 2007 這篇文章。從這裡出發前往和它相連的 2111479 篇文章,平均要點 3.45 個連結。最靠近「中心」的十篇文章,分別是 2007, Deaths in 2004(2004 年過逝的名人), 2006, 2004, List of accidents and incidents on commercial aircraft(商用飛機災難列表), Star Alliance destinations(這篇文章不見了 @@), 1990s, List of town tramway systems in North America(北美鄉鎮輕軌捷運列表), 20051967

如果不算無聊的年代、日期和列表的話,最靠近中心的「正規」文章是 United Kingdom(大不列及北愛爾蘭聯合王國,俗稱英國),平均所須點擊數是 3.67 個。緊接其後的是 Billie Jean King(嗄?)的 3.68 個,和 United States 的 3.69 個。小世界理論界的名人 Kevin Bacon(其實他也是無辜被掃到)平均要 3.98 個 click,而每天必上的 Engadget 要 4.23 次,還輸給大家心愛的 Veronica 姐姐(4.19 次)。

Wikipedia 裡平均從一篇文章連到另一篇文章(假設連得到的話)要 4.573 次點擊,但最長的一串連結要 70 多個 click。會這麼多的原因,是因為它是一長串無聊的小行星命名列表,而且要到達一頁(List of asteroids / 145701 - 145800)只有從前一頁(List_of_asteroids / 145601 - 145700)點 Next 連結才能到,所以才會變這麼長一串。

Stephen Dolan 還為自已的這個研究做了一個小遊戲(可以在這一頁的 中間部份找到),看看.....

小薑雜談:維基百科的六度分離

由 Andy Yang (Engadget) 於 2008/08/04 - 09:00 發表
arrow
arrow
    全站熱搜

    右翼天使K 發表在 痞客邦 留言(0) 人氣()