差評君
這些年來,驗證碼的形式越來越豐富,不少網(wǎng)友“吐槽”,沒有足夠的知識儲備,連驗證碼都看不懂了。不知你有沒有想過,這種明顯讓用戶體驗不佳的東西,存在的意義到底是什么?
其實,驗證碼的用處可以用簡單的一句話來解釋清楚:區(qū)分計算機和真正的人。
2000年年初,互聯(lián)網(wǎng)的浪潮剛剛在全世界掀起,當時最讓用戶苦惱的一件事就是垃圾郵件太多。甚至有一些家伙還特意設計了程序,可以終日無休止地大量注冊新郵箱賬號,用來發(fā)送垃圾推廣郵件。一位名叫路易斯的天才程序員就想到了法子,他發(fā)現(xiàn)計算機程序很難認清手寫的文本,而人類可以輕松看懂。所以,可以在注冊賬號的時候設一道門檻——必須輸入“歪曲”的文本才能完成注冊,用來識別計算機和真人。驗證碼由此而生,無數(shù)的黃牛、垃圾郵件、爬蟲程序就這樣被驗證碼擋在了門檻外面。
有網(wǎng)友計算過,全世界的網(wǎng)民每天要輸入近2億次驗證碼,每次輸入按花費10秒計算,人類每天花在驗證碼上的時間已經(jīng)超過55萬小時。
或許有人會說:“浪費時間就是浪費生命!驗證碼浪費了人類大量的生命!”不過說起來你可能不信,實際上輸入驗證碼的時間并沒有全被浪費。每一次輸入驗證碼,你都可能在為人類的文化事業(yè)或者為人工智能貢獻一分力量。
還是那個發(fā)明了驗證碼的天才路易斯,他發(fā)現(xiàn)許多公益組織在把舊書掃描成電子版,對計算機來說,那些斑駁的文字太難識別了。他想,書籍的內(nèi)容大部分是文本,驗證碼也是文本,把掃描版的書籍文本對接到驗證碼上,讓用戶來識別不就行了?于是,一個叫作reCAPTCHA的新式驗證碼系統(tǒng)誕生了。
reCAPTCHA會提供兩個單詞讓用戶識別。這兩個單詞都是書籍掃描版的一部分。計算機其實已經(jīng)知道第一個單詞是啥了,不過第二個單詞計算機暫時還沒能力認出來。面對第二個單詞,一旦有10個人輸入了同樣的答案,那么這個答案就會被當作正確答案。靠這種方法,reCAPTCHA每年能讓230多萬本舊書轉(zhuǎn)化為電子版。
除此之外,你輸入的驗證碼,還可能成為人工智能訓練的養(yǎng)料。有一類街景驗證碼,是讓人們選小轎車、路牌或者自行車等圖片。在費眼又費腦地輸入它們的時候,你其實在為谷歌的人工智能免費打工。因為這些圖片大都來自谷歌街景,其中的一部分圖片是AI(人工智能)已經(jīng)識別出來的,用來識別你是否為真人,另外還會夾雜著幾張AI難以識別的街景,需要借助于你的勞動力。而這些數(shù)據(jù),最后都會被用于培訓人工智能。在各位的“辛勤喂養(yǎng)”之下,運用了谷歌AI技術(shù)的無人駕駛汽車Waymo,已經(jīng)在自動駕駛領域處于遙遙領先的地位。
如今,收購了reCAPTCHA的谷歌已經(jīng)把大部分驗證碼升級成了reCAPTCHA v3。用戶只要點擊一下“我不是機器人”的按鈕,就能輕松通過驗證。但即便如此,驗證碼還是能從你身上吸點油水。因為在你點擊按鈕的同時,谷歌會監(jiān)控你的行為。鼠標的運動軌跡,甚至你打開的網(wǎng)頁都可能被收集,這些數(shù)據(jù)會被用來判斷你是否為真人,并且?guī)椭炞C碼系統(tǒng)進化。目前國外有超過65萬個網(wǎng)站用reCAPTCHA v3,每點擊一次驗證按鈕,就等于打卡告訴谷歌你來過這兒,谷歌就會根據(jù)你去過的網(wǎng)站來給你推送定制的廣告。
隨著OCR(光學字符識別)技術(shù)和AI的發(fā)展,驗證碼也在不斷被破解,過去簡單扭曲一下的字母,已擋不住現(xiàn)在的程序了。但無論驗證碼怎么進化,只要你是真真切切的人,驗證碼這一關(guān)都不可能真正擋住你。就像reCAPTCHA一直所倡導的那樣:Tough on bots,easy on humans(對機器人困難,對人類簡單)。
(李金鋒摘自微信公眾號“差評”,視覺中國供圖)