您的位置: 首頁 >科技 >

Facebook的人工智能檢測(cè)不到20個(gè)好友請(qǐng)求的虛假賬戶

2022-09-01 23:21:42 編輯:宇文朗 來源:
導(dǎo)讀 在今天Face book博客上的一篇文章中,工程師們描述了一種算法-SybilEdge-來檢測(cè)假賬戶,這些假賬戶在注冊(cè)時(shí)逃避Face book的反虐過濾器,...

在今天Face book博客上的一篇文章中,工程師們描述了一種算法-SybilEdge-來檢測(cè)假賬戶,這些假賬戶在注冊(cè)時(shí)逃避Face book的反虐過濾器,但還沒有足夠的朋友來延續(xù)虐待。 目標(biāo)是降低賬戶對(duì)其他用戶發(fā)起攻擊的能力,部分是通過比較用戶向擴(kuò)展社交網(wǎng)絡(luò)添加好友的方式。

SybilEdge能夠發(fā)現(xiàn)假的Face book賬戶不到一周,朋友的請(qǐng)求不到20個(gè),它立即申請(qǐng)平臺(tái)來處理關(guān)于流行的一波誤導(dǎo)性信息。 路透社牛津大學(xué)新聞學(xué)研究所發(fā)表的一項(xiàng)分析發(fā)現(xiàn),33%的人在Twitter、Face book和YouTube等社交網(wǎng)絡(luò)上看到了某種形式的關(guān)于的錯(cuò)誤信息。

在設(shè)計(jì)SybilEdge時(shí),開發(fā)團(tuán)隊(duì)指出,施虐者需要連接到目標(biāo)才能發(fā)起虐待-也就是說,他們需要找到目標(biāo),向他們發(fā)送朋友請(qǐng)求,并接受請(qǐng)求。 也許不足為奇的是,F(xiàn)ace book內(nèi)部研究表明,非用戶在選擇朋友和那些朋友對(duì)朋友請(qǐng)求的回應(yīng)方面都有所不同:假帳戶的請(qǐng)求比真實(shí)用戶的請(qǐng)求更經(jīng)常被拒絕。 此外,假賬戶在選擇朋友請(qǐng)求目標(biāo)時(shí)往往很小心,這可能會(huì)最大限度地提高他們的請(qǐng)求被接受的概率。

Face book創(chuàng)建了一個(gè)語料庫,通過將用戶分成兩組來訓(xùn)練SybilEdge:那些更有可能接受來自真實(shí)帳戶的朋友請(qǐng)求的人和那些可能接受虛假帳戶請(qǐng)求的人。 如果前者拒絕傳入的請(qǐng)求,它將發(fā)出請(qǐng)求者是合法用戶的信號(hào)。 另一方面,如果接受更多假請(qǐng)求的用戶接受請(qǐng)求,則表明請(qǐng)求者可能是假的。

西比爾邊緣分兩個(gè)階段工作。 首先,它是通過觀察上述樣本的時(shí)間來訓(xùn)練的,然后它利用Face book的行為和內(nèi)容分類器的輸出,這些分類器根據(jù)實(shí)際的濫用標(biāo)記帳戶。 這個(gè)訓(xùn)練階段為模型提供了所有必要的參數(shù)(即從數(shù)據(jù)中估計(jì)的配置變量,以及模型在進(jìn)行預(yù)測(cè)時(shí)所需的配置變量),以便為每個(gè)朋友的請(qǐng)求和響應(yīng)實(shí)時(shí)運(yùn)行,并更新請(qǐng)求者被假的概率。

Face book聲稱,SybilEdge在檢測(cè)假賬戶方面的準(zhǔn)確率高于90%,平均有15個(gè)或更少的朋友請(qǐng)求,在檢測(cè)5個(gè)朋友請(qǐng)求的假賬戶方面的準(zhǔn)確率高于80%。 此外,與其比較的基線不同,它的性能不會(huì)隨著更多的朋友請(qǐng)求而降低(超過45)。

“SybilEdge幫助我們快速識(shí)別施虐者,并以一種可以解釋和分析的方式。 在不久的將來,我們計(jì)劃研究更多的方法,可以進(jìn)一步加快發(fā)現(xiàn)濫用帳戶,并幫助作出自信的決定,甚至比SybilEdge更快。 我們計(jì)劃通過混合基于特征和基于行為的模型來實(shí)現(xiàn)這一點(diǎn),“Face book寫道。

Face book正向一種名為自我監(jiān)督學(xué)習(xí)的人工智能培訓(xùn)技術(shù)邁進(jìn),在這種技術(shù)中,未標(biāo)記數(shù)據(jù)與少量標(biāo)記數(shù)據(jù)一起使用,以提高學(xué)習(xí)精度。 Face book的深度實(shí)體分類(DEC)機(jī)器學(xué)習(xí)框架在部署以來的兩年里導(dǎo)致平臺(tái)上濫用賬戶減少了20%。 在一個(gè)單獨(dú)的實(shí)驗(yàn)中,F(xiàn)ace book的研究人員能夠訓(xùn)練一個(gè)語言理解模型,該模型只有80個(gè)小時(shí)的數(shù)據(jù),而人工標(biāo)記的數(shù)據(jù)為12,000個(gè)小時(shí)。


免責(zé)聲明:本文由用戶上傳,如有侵權(quán)請(qǐng)聯(lián)系刪除!

最新文章

精彩推薦

圖文推薦

點(diǎn)擊排行

2016-2022 All Rights Reserved.平安財(cái)經(jīng)網(wǎng).復(fù)制必究 聯(lián)系QQ280 715 8082   備案號(hào):閩ICP備19027007號(hào)-6

本站除標(biāo)明“本站原創(chuàng)”外所有信息均轉(zhuǎn)載自互聯(lián)網(wǎng) 版權(quán)歸原作者所有。