輸入驗證碼，為人類文明添磚加瓦

2020-11-18 01:58:34差評君

讀者·校園版 2020年23期

差評君

這些年來，驗證碼的形式越來越豐富，不少網(wǎng)友“吐槽”，沒有足夠的知識儲備，連驗證碼都看不懂了。不知你有沒有想過，這種明顯讓用戶體驗不佳的東西，存在的意義到底是什么？

其實，驗證碼的用處可以用簡單的一句話來解釋清楚：區(qū)分計算機和真正的人。

2000年年初，互聯(lián)網(wǎng)的浪潮剛剛在全世界掀起，當時最讓用戶苦惱的一件事就是垃圾郵件太多。甚至有一些家伙還特意設計了程序，可以終日無休止地大量注冊新郵箱賬號，用來發(fā)送垃圾推廣郵件。一位名叫路易斯的天才程序員就想到了法子，他發(fā)現(xiàn)計算機程序很難認清手寫的文本，而人類可以輕松看懂。所以，可以在注冊賬號的時候設一道門檻——必須輸入“歪曲”的文本才能完成注冊，用來識別計算機和真人。驗證碼由此而生，無數(shù)的黃牛、垃圾郵件、爬蟲程序就這樣被驗證碼擋在了門檻外面。

有網(wǎng)友計算過，全世界的網(wǎng)民每天要輸入近2億次驗證碼，每次輸入按花費10秒計算，人類每天花在驗證碼上的時間已經(jīng)超過55萬小時。

或許有人會說：“浪費時間就是浪費生命！驗證碼浪費了人類大量的生命！”不過說起來你可能不信，實際上輸入驗證碼的時間并沒有全被浪費。每一次輸入驗證碼，你都可能在為人類的文化事業(yè)或者為人工智能貢獻一分力量。

還是那個發(fā)明了驗證碼的天才路易斯，他發(fā)現(xiàn)許多公益組織在把舊書掃描成電子版，對計算機來說，那些斑駁的文字太難識別了。他想，書籍的內(nèi)容大部分是文本，驗證碼也是文本，把掃描版的書籍文本對接到驗證碼上，讓用戶來識別不就行了？于是，一個叫作reCAPTCHA的新式驗證碼系統(tǒng)誕生了。

reCAPTCHA會提供兩個單詞讓用戶識別。這兩個單詞都是書籍掃描版的一部分。計算機其實已經(jīng)知道第一個單詞是啥了，不過第二個單詞計算機暫時還沒能力認出來。面對第二個單詞，一旦有10個人輸入了同樣的答案，那么這個答案就會被當作正確答案。靠這種方法，reCAPTCHA每年能讓230多萬本舊書轉(zhuǎn)化為電子版。

除此之外，你輸入的驗證碼，還可能成為人工智能訓練的養(yǎng)料。有一類街景驗證碼，是讓人們選小轎車、路牌或者自行車等圖片。在費眼又費腦地輸入它們的時候，你其實在為谷歌的人工智能免費打工。因為這些圖片大都來自谷歌街景，其中的一部分圖片是AI（人工智能）已經(jīng)識別出來的，用來識別你是否為真人，另外還會夾雜著幾張AI難以識別的街景，需要借助于你的勞動力。而這些數(shù)據(jù)，最后都會被用于培訓人工智能。在各位的“辛勤喂養(yǎng)”之下，運用了谷歌AI技術(shù)的無人駕駛汽車Waymo，已經(jīng)在自動駕駛領域處于遙遙領先的地位。

如今，收購了reCAPTCHA的谷歌已經(jīng)把大部分驗證碼升級成了reCAPTCHA v3。用戶只要點擊一下“我不是機器人”的按鈕，就能輕松通過驗證。但即便如此，驗證碼還是能從你身上吸點油水。因為在你點擊按鈕的同時，谷歌會監(jiān)控你的行為。鼠標的運動軌跡，甚至你打開的網(wǎng)頁都可能被收集，這些數(shù)據(jù)會被用來判斷你是否為真人，并且?guī)椭炞C碼系統(tǒng)進化。目前國外有超過65萬個網(wǎng)站用reCAPTCHA v3，每點擊一次驗證按鈕，就等于打卡告訴谷歌你來過這兒，谷歌就會根據(jù)你去過的網(wǎng)站來給你推送定制的廣告。

隨著OCR（光學字符識別）技術(shù)和AI的發(fā)展，驗證碼也在不斷被破解，過去簡單扭曲一下的字母，已擋不住現(xiàn)在的程序了。但無論驗證碼怎么進化，只要你是真真切切的人，驗證碼這一關(guān)都不可能真正擋住你。就像reCAPTCHA一直所倡導的那樣：Tough on bots，easy on humans（對機器人困難，對人類簡單）。

（李金鋒摘自微信公眾號“差評”，視覺中國供圖）

輸入驗證碼，為人類文明添磚加瓦

輸入驗證碼，為人類文明添磚加瓦