抖音首度披露算法機制:利用神經(jīng)網(wǎng)絡(luò)預(yù)估用戶行為,不依賴打標(biāo)簽,“機器+人工”雙重審核
澎湃新聞記者 范佳來
當(dāng)算法已經(jīng)深刻融入日常生活中,平臺應(yīng)當(dāng)如何管理算法,才能避免其無序發(fā)展、走向失控?
4月16日,澎湃新聞記者獲悉,近期抖音在北京舉辦“安全與信任中心開放日”活動,首次對平臺算法原理、平臺治理體系以及社會關(guān)切的問題進(jìn)行較為詳細(xì)的披露。
抖音曾經(jīng)多次因為算法,陷入輿論爭議。去年農(nóng)夫山泉董事長鐘睒睒曾經(jīng)喊話字節(jié)跳動創(chuàng)始人張一鳴,請求頭條和抖音停止對一個中國公民的侵害,“今日頭條你是實際控制人,同樣你是盈利性企業(yè)。你是一個有足夠量掌控輿論的平臺企業(yè),因為這樣的背景,所以請你承擔(dān)企業(yè)文明的規(guī)則!
面對此前吳柳芳案件等帶來的算法和流量質(zhì)疑,抖音副總裁李亮曾經(jīng)多次在公開平臺回應(yīng),但始終未正面披露其背后的算法機制。
在此次發(fā)布會上,抖音算法工程師劉暢介紹,抖音推薦算法作為人工智能機器學(xué)習(xí)技術(shù)的重要應(yīng)用場景,本質(zhì)上是一套高效的信息過濾系統(tǒng)。
在抖音的實際應(yīng)用中,平臺推薦系統(tǒng)采取“人工+機器”協(xié)同的方式進(jìn)行風(fēng)險治理:由人工運營和治理體系為算法導(dǎo)航;同時多目標(biāo)體系算法主動打破 “信息繭房”,為用戶帶來更豐富的推薦結(jié)果。
從推薦算法來看,抖音與國內(nèi)外大部分內(nèi)容推薦平臺相似,包含召回、過濾、排序等環(huán)節(jié),重點是學(xué)習(xí)用戶行為。抖音基于用戶行為的推薦方法包含多種技術(shù)模型,如協(xié)同過濾、雙塔召回、Wide&Deep模型(均為推薦系統(tǒng)中常用模型)等。算法可以在完全“不理解內(nèi)容”的情況下,找到興趣相似的用戶,把其他人感興趣的內(nèi)容推薦給該用戶。
目前,抖音算法已幾乎不依賴對內(nèi)容和用戶打標(biāo)簽,而是通過神經(jīng)網(wǎng)絡(luò)計算,預(yù)估用戶行為,計算用戶觀看這條內(nèi)容獲得的價值總和,把排名靠前的內(nèi)容推給用戶。
談到外界擔(dān)憂的“信息繭房”問題,劉暢介紹,抖音算法在多目標(biāo)建模體系下,設(shè)置專門的探索維度:一是對用戶在平臺上已經(jīng)表現(xiàn)出的興趣,盡可能推薦更多樣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次。
二是幫助用戶探索更多新興趣,采用隨機推薦、基于用戶社交關(guān)系拓展興趣、搜索推薦聯(lián)動、“不感興趣”不再展現(xiàn)等多種方式,讓用戶的主動行為影響推薦系統(tǒng),使推薦更加個性化和多樣化。
算法能學(xué)習(xí)、預(yù)估用戶行為,但因其無法理解內(nèi)容語義,對內(nèi)容的理解存在不足,可能導(dǎo)致違法違規(guī)、不良內(nèi)容被推薦傳播。因此,算法在真實使用場景中,必須由平臺治理對其進(jìn)行約束和規(guī)范。
在內(nèi)容治理方面,據(jù)抖音生態(tài)運營經(jīng)理陳丹丹介紹,抖音的體系是“人工參與+機器學(xué)習(xí)”相結(jié)合的模式,并組建專門的平臺治理團(tuán)隊為算法設(shè)置“護(hù)欄”,具體治理體系包括異常感知、標(biāo)準(zhǔn)定義、機器識別、人工研判、風(fēng)險處置等過程。
治理流程秉持兩大準(zhǔn)則:第一:所有在平臺發(fā)布的內(nèi)容都會經(jīng)過評估,流量越高的內(nèi)容評估次數(shù)越多,標(biāo)準(zhǔn)也越嚴(yán)格。
第二:抖音內(nèi)容審核采用“人工+機器”相互配合的模式,“機器”負(fù)責(zé)“寬度”評估所有投稿,“人工”負(fù)責(zé)“深度”,確保專業(yè)、敏感或疑難等問題盡可能精準(zhǔn)研判。
創(chuàng)作者將內(nèi)容上傳至抖音后,首先進(jìn)入機器識別環(huán)節(jié)。如果內(nèi)容被識別出含有高危特征,將被直接攔截;若未命中高危特征但模型判斷有問題,則會送至人工審核,若問題概率較低,則獲得基礎(chǔ)流量進(jìn)入下一環(huán)節(jié)。
視頻被舉報、評論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況出現(xiàn),均可能觸發(fā)“人工+機器”審核。一旦內(nèi)容在任一環(huán)節(jié)被處置,系統(tǒng)會立即停止進(jìn)一步推薦和分發(fā)。
針對社會普遍關(guān)心的、對用戶造成較多困擾的焦點問題,抖音成立數(shù)個專項治理團(tuán)隊,針對詐騙、網(wǎng)暴、虛假擺拍、未成年人保護(hù)、網(wǎng)絡(luò)水軍、AIGC技術(shù)濫用等一系列重大專項風(fēng)險進(jìn)行治理。例如,在不實信息治理方面,抖音于近日上線了辟謠卡,遏制不實信息的傳播。
此外,抖音安全與信任中心網(wǎng)站已經(jīng)處于試運行階段,正廣泛向用戶、創(chuàng)作者、社會各界征集意見。
算法治理已成為當(dāng)今平臺面臨的共同問題。此前中央網(wǎng)信辦副主任、國家網(wǎng)信辦副主任牛一兵在“堅持主流價值導(dǎo)向 推動算法向上向善”主題分享會上致辭時強調(diào),中央網(wǎng)信辦聚焦黨中央關(guān)心、人民群眾關(guān)切的算法問題,以壓實網(wǎng)站平臺主體責(zé)任為抓手,出臺系列政策法規(guī),構(gòu)建算法備案、安全評估、監(jiān)測檢查、執(zhí)法處罰等全流程監(jiān)管體系,算法應(yīng)用生態(tài)持續(xù)向好。
加強算法治理,是維護(hù)網(wǎng)絡(luò)安全和意識形態(tài)安全的關(guān)鍵環(huán)節(jié),是推動平臺經(jīng)濟(jì)健康可持續(xù)發(fā)展的有力保障,是維護(hù)人民群眾利益的具體行動。要內(nèi)化導(dǎo)向要求,把準(zhǔn)算法治理“定盤星”,堅持黨管互聯(lián)網(wǎng)原則,把主流價值導(dǎo)向貫穿算法設(shè)計、開發(fā)、應(yīng)用全過程。要凈化內(nèi)容生態(tài),守好算法應(yīng)用“責(zé)任田”,加強網(wǎng)上正能量推送,嚴(yán)禁算法助推低俗信息傳播,提高算法設(shè)計的透明度和算法運行的可解釋性。
去年11月,中央網(wǎng)信辦等部門聯(lián)合發(fā)布的《關(guān)于開展“清朗·網(wǎng)絡(luò)平臺算法典型問題治理”專項行動的通知》提出,優(yōu)化檢索、排序、推送等規(guī)則的透明度和可解釋性,預(yù)防和減少爭議糾紛。以適當(dāng)方式公示算法推薦服務(wù)的基本原理、目的意圖、主要運行機制等,確保簡單、清晰、可理解。
本網(wǎng)站所刊載信息,不代表中新經(jīng)緯觀點。 刊用本網(wǎng)站稿件,務(wù)經(jīng)書面授權(quán)。
未經(jīng)授權(quán)禁止轉(zhuǎn)載、摘編、復(fù)制及建立鏡像,違者將依法追究法律責(zé)任。
[京B2-20230170] [京ICP備17012796號-1]
違法和不良信息舉報電話:18513525309 報料郵箱(可文字、音視頻):zhongxinjingwei@chinanews.com.cn
Copyright ©2017-2025 jwview.com. All Rights Reserved
北京中新經(jīng)聞信息科技有限公司