百度百科外鏈指向色情網(wǎng)站怎么回事 百度:已刪除并全面排查

2019-03-01 09:44:59 來源:互聯(lián)網(wǎng)作者:佚名 人氣: 次閱讀 643 條評論

此前在朋友圈刷屏的“搜索引擎百度已死!”一文作者“方可成實(shí)驗(yàn)室”,近日再發(fā)文爆料,在百度搜索廣州大量小學(xué)和幼兒園時(shí),排在第一位的百度百科底部的參考文...

此前在朋友圈刷屏的“搜索引擎百度已死!”一文作者“方可成實(shí)驗(yàn)室”,近日再發(fā)文爆料,在百度搜索廣州大量小學(xué)和幼兒園時(shí),排在第一位的百度百科底部的參考文獻(xiàn)鏈接被指向了色情網(wǎng)站,引發(fā)諸多網(wǎng)友熱議,隨后百度方面也介入處理。

百度百科外鏈指向色情網(wǎng)站怎么回事 百度:全面排查并清理
百度

百度百科外鏈指向色情網(wǎng)站怎么回事?

據(jù)爆料,一位廣州的家長在微博上給“方可成實(shí)驗(yàn)室”發(fā)來私信,他發(fā)現(xiàn):在百度中搜索廣州的很多小學(xué)和幼兒園的名字,結(jié)果中排在首位的一般都是百度百科,而進(jìn)入百度百科頁面之后,點(diǎn)擊參考文獻(xiàn)中的“廣州上學(xué)網(wǎng)”,卻會進(jìn)入色情網(wǎng)站。

百度百科外鏈指向色情網(wǎng)站怎么回事 百度:全面排查并清理

百度百科外鏈指向色情網(wǎng)站怎么回事 百度:全面排查并清理

隨后深入分析會發(fā)現(xiàn),廣州有大量的小學(xué)、幼兒園百科參考鏈接也有類似的問題,測試發(fā)現(xiàn)至少還包括:

廣州開發(fā)區(qū)第二小學(xué)、廣州市海珠區(qū)星云幼兒園、廣州市越秀區(qū)大沙頭中英文幼兒園、沙河小學(xué)、北山小學(xué)、化龍中心小學(xué)、濱江東路第二小學(xué)、左邊小學(xué)、復(fù)甦小學(xué)、五鳳小學(xué)、芳華小學(xué)、協(xié)和小學(xué)、廣州市海珠區(qū)江南西藝星幼兒園、廣州市越秀區(qū)黃金實(shí)驗(yàn)幼兒園、小洲小學(xué)、僑樂小學(xué)、金影小學(xué)、培紅小學(xué)、天河區(qū)龍洞小學(xué)、同福西路小學(xué)、聚德西路小學(xué)、博雅小學(xué)、天河區(qū)棠下小學(xué)、長安東街小學(xué)、增滘小學(xué)、禾豐小學(xué)、長湴小學(xué)、天河區(qū)駿景米洛英文幼兒園、瑞寶花園小學(xué)、黃村小學(xué)、廣雅實(shí)驗(yàn)學(xué)校、橫沙小學(xué)、花都區(qū)新華鎮(zhèn)九潭小學(xué)、從化市從化英才幼兒園、樂賢坊小學(xué)、黃埔同仁小學(xué)、握山小學(xué)、三善小學(xué)、....。

為什么會出現(xiàn)廣州小學(xué)和幼兒園大量百度百科參考鏈接指向色情網(wǎng)站呢?

作者隨著分析發(fā)現(xiàn),以上這些廣州小學(xué)或幼兒園的百度百科的參考鏈接都是指向之前的“廣州上學(xué)網(wǎng)”。“廣州上學(xué)網(wǎng)”此前是一個(gè)真實(shí)的學(xué)校信息綜合匯集網(wǎng)站,這些學(xué)校的百度百科頁面在編寫的時(shí)候,確實(shí)是指向了真正的“廣州上學(xué)網(wǎng)”。

但后來,“廣州上學(xué)網(wǎng)”網(wǎng)站關(guān)閉了,內(nèi)容無法再訪問。再后來,“廣州上學(xué)網(wǎng)”的域名被色情網(wǎng)站運(yùn)營者買下,設(shè)置成了自動跳轉(zhuǎn)色情網(wǎng)站。這樣一來,所有原本指向“廣州上學(xué)網(wǎng)”的鏈接,現(xiàn)在都會被跳轉(zhuǎn)到色情網(wǎng)站。

百度百科外鏈指向色情網(wǎng)站怎么回事 百度:全面排查并清理

所以,這次百度是躺槍了?都怪色情網(wǎng)站太狡猾,百度對此并無責(zé)任?雖然說比較避免,其實(shí),沒有檢測和處理過期鏈接也是一個(gè)不可逃避的問題。

過期鏈接問題一直也是互聯(lián)網(wǎng)面臨的一大挑戰(zhàn),我們可以對比一下維基百科是怎么做的。為了處理過期鏈接問題,維基百科特別制定了如何處理過期鏈接的詳細(xì)規(guī)則。

百度百科外鏈指向色情網(wǎng)站怎么回事 百度:全面排查并清理

過去幾年中,在互聯(lián)網(wǎng)檔案館(Internet Archive)的幫助下,維基百科還利用機(jī)器人自動檢測失效鏈接,并替換為有效的歷史存檔鏈接,搶救了多達(dá)900萬個(gè)失效鏈接。

簡單來說,百度只要分配一些人工智能資源給百科失效鏈接檢測,就不會出現(xiàn)今天的這種現(xiàn)象。另外,根據(jù)時(shí)光機(jī)網(wǎng)站抓取頁面顯示,從2018年開始,百科中的“廣州上學(xué)網(wǎng)”鏈接就已經(jīng)開始跳轉(zhuǎn)到了色情網(wǎng)站,只不過很多人可能沒有注意到或者曝光,直到這次被曝光了出來。