廣告主對優質流量有多熱愛,對虛假流量就有多痛恨。日前,力美科技全面升級智能反作弊機制,化身“火眼金睛”系統排查異常流量,初步估算目前國內移動互聯網異常流量約占總移動流量的20%-30%。如圖一所示,2016年10月24日到11月7日每天異常流量分布如下:
升級后的力美DSP流量智能反作弊機制,以“機器+人工”的雙重保險對異常流量進行全面排查。力美科技反作弊項目負責人介紹,力美DSP流量智能反作弊機制從App基本信息、設備分布、時間分布(如圖二所示)、地域分布、IP分布等層面共計70多項緯度進行篩查,累計得分較高的將被列入異常流量高危區間,由人工進行逐一排查,最終確定是否為虛假流量。由人工排查后產生的正負樣本,作為訓練集訓練機器學習的模型,模型反過來會給出更為精準的識別,由此經過反復迭代,可以做到完全自動化,由機器來識別。
首先,力美DSP智能反作弊機制歸納抽取描述媒體的特征,如該媒體一天的UV占該媒體下載量的比例,以此來對照所有媒體的緯度特征,利用統計學發現異常媒體;其次,隨著異常媒體緯度特征的積累,總結出異常媒體全方位、多角度、立體式的異常區間值,利用異常檢測算法給各個特征加上權重,大批量篩選出異常媒體流量;第三,異常檢測縮小異常流量的范圍,將那些有作弊嫌疑的媒體找到,對有作弊嫌疑的App進行人工甄別,判斷哪些媒體是真的作弊,哪些媒體雖然異常但沒有作弊;第四,對人工標注的結果,機器學習算法據此學習到新的特征權重,新的特征權重將會使異常度的計算更為精準,評判作弊流量更加有據可依,由此完成反作弊模型的閉環優化,形成一套完整的智能反作弊機制模型。
截止目前,力美DSP流量智能反作弊機制發現的異常流量約有以下幾種類型:第一類,異常指標多,只有少量IP或設備,主要由沒有傳送設備和固定IP,或使用少數設備和IP刷量造成;第二類,平均每個設備或每個IP發送的request過高,由虛假流量故意刷量造成,將導致廣告的無效展示;第三類,國外流量占比過高或某個地域流量占比過高,通常是集中在某個地域的應用或惡意刷量造成;第四類,夜晚流量占比異常或某個時段的流量占比過高,排除正常使用原因,這種情況通常是虛假流量的惡意刷量。
目前,力美DSP流量智能反作弊機制發現的中國移動互聯網異常流量約占總移動流量的20%-30%,最終確定的虛假流量將被屏蔽處理。當虛假流量被屏蔽,力美DSP可用于廣告采買投放的流量池將得到極大的凈化,這對廣告主來說,既保護了正當權益不受侵害,又大大縮減投放成本,凈化了行業發展環境,更是行業發展之幸。