當前位置:
首頁 > 最新 > 直播答題贏100萬很難?其實你也可以藉助「工具」來幫忙

直播答題贏100萬很難?其實你也可以藉助「工具」來幫忙

最近,「答題」代替「共享」成為了互聯網上的新一輪熱詞。從王思聰「撒幣」開始,各路互聯網大佬紛紛湧入,直播 APP 們利用這種真金白銀的吸引流量方式提升了自己的熱度,還從各種廣告商手裡「變現」了一波。相信各位美友就算沒有玩過也應該聽到過「芝士超人」,「沖頂大會」,「百萬英雄」等等答題活動,不過這篇文章討論的不是它們,而是利用信息獲取優勢參合進這波狂歡中的各種答題助手。


▎花樣繁多的答題助手

Ps:本文提到的所有答題助手都不會提供下載,有興趣的美友可以自行尋找相應的 App 。

說到答題助手首先要提的當然是搜狗推出的「汪仔」了,它號稱是「不需要問答資料庫,通過機器搜索語義以及搜索並給出唯一答案。」。在實際使用中,雖然「汪仔」的準確率在各種答題助手中算是是很不錯的,但仍然達不到 100% 的正確率,對於一些反問和模糊語義題它就愛莫能助了。

值得一說的是,搜狗在最新的搜狗輸入法裡面直接內置了「汪仔答題助手」,支持百萬英雄答題。看樣子搜狗是要死磕答題助手這塊了,甚至不惜讓輸入法變得更加臃腫。

然後是比較早出現的「小不點」,特點是通過識別主持人的語音獲取題目,支持三大答題 App。不過先不說它的正確率,它的語音識別可以用一句話來評價:「題目稍微長一點,等主持人讀完題目,怕是早就涼了」。

接著 UC 也加入了助手的行列,弄了一個「UC 答題助手」,不需要 App 只需要打開助手網頁即可,支持百萬英雄。看情況應該是答題助手那邊人工/機器識別題目之後把答案推送到網頁上,好處是不需要用戶本地識別,題目識別率應該會高一點。

最後再說說百度的「簡單搜索」,這個 App 並不是為了答題而誕生的,它原本只是個簡單的搜索工具(22M 大的「簡單」搜索。。。),不過因為實時語音識別搜索而被大家「開發」出了答題的用途,百度隨後也添加了 Dan 哥的答題直播間,支持三大答題 App 和其他一些平台,識別率也是助手中的第一梯隊(畢竟有百度搜索加持)。


無論是上面提到的比較多人用的答題助手還是最近噴涌而出的各種五花八門的助手,它們的原理都是相似的,接下來我就給大家簡單講講它們的原理。最後再總結一下這些答題助手的優缺點。

想要實現自動答題,第一步當然就是要獲取題目,結合答題 App 的實際情況大概有下面幾種方法:

語音識別主持人/用戶讀出的題目

截圖之後進行 OCR(提取圖片文字)

利用 Android 的無障礙服務直接獲取文本

後台抓流量數據包提取文本

其中大部分答題助手採用的是語音識別的方式,所以這些助手會提醒你使用的時候音量不要開得太大。缺點之前也說了,要是題目太長等到讀完基本也就涼了;截圖 OCR 的答題助手也不少,像是「汪仔」就是這樣,其他助手用的一般就是百度提供的 OCR API;無障礙服務獲取文本比以上地方法都要快,不過只有 Android 上具有可行性;以上提到的方法都符合各種答題 App 的規則,不屬於人們常說的「外掛」,而抓取數據包提取文本這個就明顯不符合遊戲規則啦,所以一般答題助手都不會用這個方法。還有一些亂七八糟的答題助手直接就是抓其他助手的數據,像是「簡單搜索」的數據就被抓得比較多,這種「歪門邪道」比抓包還要無恥。

獲取到題目後,有這幾種獲取答案的方法:

直接把題目扔進百度或者其他搜索引擎,獲取包括每條結果快照的結果頁文本,然後在裡面尋找每一個選項出現的次數,次數多的那個就是推薦選項。

把題目 + 選項扔進百度或者其他搜索引擎,看每一個選項的搜索結果數目,數目多的那個即為推薦選項。

從網上下載盡量多的題庫,然後利用題目關鍵詞在題庫裡面尋找正確選項。

對題目進行 NLP(自然語言處理),提取出關鍵詞後再進行查詢。

大公司的答題助手可能還有諸如機器學習等等優化步驟。

答題助手的原理基本上跳不出上面幾種,先說一下,像是搜狗這種手握搜索引擎的大公司都沒辦法把搜索結果優化到 100% 正確,當然上面幾種方法的正確率更低。

第一種和第二種方法乍看之下好像都差不多,不過第一種方法對於題目和正確選項關聯密切的題效果比較好(比如:中國的首都和北京),而且只需要聯網搜索一次,可以節省不少時間;第二種方法則要對每個選項搜索一次,時間上可能會多一點,不過對於題目和正確選項關聯不那麼密切的題目會比較好(比如:下列那句話魯迅沒說過? 與我去對面買幾個橘子)。

第三種方法適用於像「頭腦王者」這種可以不斷嘗試的答題平台,通過偽造請求和對戰不斷答題可以一步步獲取題庫,最後達到複製整個題庫的目的。至於直播答題的答題平台,利用網上的題庫有時會有奇效。

最後再說說優化,各個答題平台對於答題助手的泛濫也不是無動於衷,像是「反問題」和「個性題」就是針對答題助手的反擊措施。對於這種題目,答題助手們就要用上更高級的 NLP 了。

就以「下列那句話魯迅沒說過?」為例,無論你是用第一還是第二種方法,最後得出的推薦選項肯定是錯誤的(魯迅+他說過的話搜索結果數量肯定高於沒說過的話),而用 NLP 可以從題目中提取出「沒」或者類似關鍵字,從而讓程序知道需要把結果反過來對比。更加複雜的 NLP 還可以用於破解「個性題」,不過這種難度可以將非主流的答題助手都攔在門外,只有大公司們可以讓攻城獅們加班順手優化一下(笑)。


說了這麼多原理,大家可能還是不懂哪個答題助手比較好,我的意見是 —— 哪個都不好。畢竟答題時間只有那幾秒,各種延遲多可以讓你泡湯一張復活卡,如果你實在要用答題助手,最好的方式還是自己做一個。

我推薦的方法:先收集足夠大的題庫,然後每次獲取到題目後先在題庫裡面查找(本地數據查找時間可以忽略不計),如果沒有找到再利用本地分詞檢測是否有「沒」或者類似關鍵字,這一步還可以自己根據常玩的平台添加更多的優化檢測。得到關鍵詞後先用方法二搜索,返回搜索結果。再後台利用方法一搜索校對,如果方法一與方法二得出的推薦選項不相同,並且答題時間還沒有結束,再列出來讓你自己選擇。

Github 上已經有許多基本工具(大部分是 Python 寫的。。。果然是 Python 大法好),可以省去很多製作時間,有能力又有需求的美友可以嘗試一下,Github 搜索「答題」即可。至於各位不會編程的,吃瓜美友,只能根據自己的需求去尋找比較好用的答題助手咯。

最後祝大家答題愉快!盆滿缽滿!

GIF


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 最美應用 的精彩文章:

通過繪畫來改變這個世界,你不能沒有它

TAG:最美應用 |