Google ReCaptcha 語音驗證碼遭破解!準確率高達 85%

評論
評論
Photo Credit: UnCaptcha 網站首頁截圖

原文《谷歌 ReCaptcha 系統被破解,機器語音驗證準確率高達 85%》刊登於雷鋒網,作者靈火 K,INSIDE 獲授權轉載。

美國馬里蘭大學的四位研究員開源了一個名為 UnCaptcha 的工具,能夠破解 Google 的驗證碼系統 ReCaptcha,其進行語音驗證的準確率高達 85%。

與眾多驗證機制一樣,早期的 ReCaptcha 系統透過數字驗證碼進行辨識,以此確保操作方是人類而非機器人。但是,2012 年一個 Google 研究團隊幾乎百分之百破解了其文本驗證碼系統。於是 Google 在這之後的升級版當中加入了語音和圖像驗證的方式。

如今,上述驗證方式再次遭遇巨大挑戰。「 Google 的 ReCaptcha 系統使用了一些高級的分析工具來判斷一個用戶到底是人還是機器人。他們使用了多種元素,包括 cookie、解題的速度、指標的移動以及解題的成功率。」

據該專案負責人稱:「ReCaptcha 系統的語音辨識系統由一長串數字讀音組成,每個字的語速、音調都不相同,甚至還會改變口音。為了解析這些數字,首先需要從網頁上將音檔文件下載下來,再導入線上的語音辨識工具中(比如 IBM、 Google 雲、 Google 語音辨識、Sphinx、Wit-AI、微軟 Bing 語音辨識)進行辨識,再將解析後的結果嵌入驗證框即可通過驗證。」

目前,UnCaptcha 工具已經在著名的 Reddit 網站進行實驗。據悉,實驗者在進行用戶註冊那一步的時候終止了實驗,這也是為了不為該網站增添不必要的營運風險。

「實驗結果非常明顯,UnCaptcha 在辨識數字方面的準確率高達 92%,整體語音辨識準確率達到了 85%。」 該工具的發明者在一份聲明中稱:「這種工具能夠破解最新版的 ReCaptcha,但這僅限於在自己網站上使用且僅用於教育目的。」

得到破解技術後,該負責人第一時間通知了 Google 並督促對現有驗證方式進行升級。目前,UnCaptcha 工具已經開源,並被托管在 GitHub 上,提供了安裝使用範例。

在 GitHub 上,網友們也針對此事展開討論。有網友稱:「此專案的核心破解技巧使用到了各家的語音辨識技術,這其中也包括 Google ,這看起來多少有點『搬石頭砸自己腳』的意味。」

相關文章

評論