驗證碼反人類:該扔掉了!

2015-12-11 11:00:00 來源:環(huán)球科學 作者:佚名 人氣: 次閱讀 136 條評論

在現(xiàn)代社會,但凡出點什么問題,都是靠設置屏障的手段解決。音樂盜版?防拷貝保護。網(wǎng)站被黑?更復雜的密碼。不幸的是,這些屏障往往是給守規(guī)矩的好公民添麻煩,對壞家伙...

在現(xiàn)代社會,但凡出點什么問題,都是靠設置屏障的手段解決。音樂盜版?防拷貝保護。網(wǎng)站被黑?更復雜的密碼。

不幸的是,這些屏障往往是給守規(guī)矩的好公民添麻煩,對壞家伙的攔截倒沒啥用。真正的音樂盜版者、網(wǎng)絡黑客,照樣有辦法繞開這些屏障。

或許這些屏障足以防范最一般的非法操作。有種名為“驗證碼”(驗證碼一詞的英文叫做Captcha,即Completely Automated Public Turing Test to Tell Computers and Humans Apart的首字母縮寫,意為“全自動區(qū)分計算機和人類的圖靈測試”)的網(wǎng)絡路障,其內部邏輯似乎便是如此。

這東西你肯定見到過,就是一串常在你網(wǎng)上注冊時出現(xiàn)的歪七扭八的字符——既有確實存在的英語單詞,也有無實義的字母組合。你需要用鍵盤把你看到的字符錄入到一個文本框里。

驗證碼出自美國卡內基梅隆大學研發(fā)人員的設計,用來防范那些可能對在線服務造成威脅的僵尸程序(一種自動執(zhí)行的黑客程序)。例如有的僵尸程序會注冊大量的Hotmail或雅虎郵箱賬號,以便散播垃圾郵件。有的會發(fā)布一些虛假評論,企圖以此提升網(wǎng)站在搜索結果中的排名。

理論上,只有真人才能識別出驗證碼圖片中的字符。扭曲的字母同駁雜的背景,用人眼足以看清,計算機則不行。放行好人,攔截壞人——看起來這是一道完美的屏障。

實際上,驗證碼不過是以暴制暴。首先,驗證碼的圖片常常扭曲得連人眼都認不出來。這在那些無實義的字詞中體現(xiàn)得格外明顯,就像“rl10Ozirl”。里面用的到底是小寫的字母“L”還是數(shù)字“1”?是數(shù)字“0”還是字母“O”?再者,這項設計的前提是視覺能力。對失明人士而言,就無法玩兒圖片驗證碼的游戲。

最好的驗證碼方案(如果這不算打自己臉的話)提供了變通的余地。例如添加一個按鈕,能夠讓你在看不清當前圖片時另換一張,還有為失明人士設計的語音驗證碼。

不過最重要的是,越來越多的證據(jù)表明,在這場技術大戰(zhàn)中,驗證碼敗象漸露。無論研究人員,還是垃圾信息散播者,都有辦法繞開這道障礙。

也有網(wǎng)站開始嘗試棄用圖片驗證碼,改為用戶體驗感覺不那么糟糕的題目。做道簡單的數(shù)學題,回答一個簡單的問題,辨認一張照片,聽段經(jīng)過混音處理的音頻。雖說所有這些方案還是免不了會將某個群體區(qū)隔在外——比如非英語人群或是失聰人士。

據(jù)卡內基梅隆大學的研發(fā)小組估算,全球人口每天在這些煩人的屏障入口處所耗費的時間,累計可達150000小時(17年)。

有種新型的驗證碼——“多重驗證碼”(reCaptcha),至少是把這些時間用在了公共價值的創(chuàng)造上。你看到的圖片是一個從掃描不良的谷歌圖書中截取出來的模糊單詞;而你輸入該詞拼寫的過程,其實就是在協(xié)助谷歌處理、識別一段有效文本。

即便如此,我們這些守規(guī)矩的用戶,每天還是會浪費掉17年的時間。這簡直是對生命的可恥浪費。一定還有其他更好的解決方案值得我們探究。

也許應該設計一款自愿出示的互聯(lián)網(wǎng)身份證,這樣一來,不管我們要注冊什么,身份都是已知的。也許網(wǎng)站應該對每個“人”的新賬號或新發(fā)表的言論施以一段時間的限制。或是監(jiān)測用戶的鍵盤輸入速度或不規(guī)則程度,以此判別他們是不是人類。

或者用指紋,用視網(wǎng)膜掃描。諸如此類。

散播垃圾內容的僵尸程序很討厭,這沒錯。可驗證碼同樣討厭。它極其煩人,它并非萬無一失,它對所有用戶搞有罪推定。

Captcha的真正含義,換個說法來說就是Computers Annoying People with Time-wasting Challenges that Howl for Alternatives——計算機那些浪費人們時間的防御機制。

是時候做出改變了。

驗證碼 反人類