今日頭條搜索優(yōu)化是今日頭條APP里內(nèi)嵌的搜索引擎,不僅能搜索站內(nèi)自媒體發(fā)布的相關(guān)信息,還能搜到站外信息,用戶可通過今日頭條上面的搜索框進(jìn)行試用。今日頭條SEO優(yōu)化有三個維度的變量。
第一個維度是內(nèi)容
頭條現(xiàn)在已經(jīng)是一個綜合內(nèi)容平臺,圖文、視頻、UGC小視頻、問答、微頭條,每種內(nèi)容有很多自己的特征,需要考慮怎樣提取不同內(nèi)容類型的特征做好推薦。
第二個維度是環(huán)境特征
這是移動互聯(lián)網(wǎng)時代推薦的特點(diǎn),用戶隨時隨地移動,在工作場合、通勤、旅游等不同的場景,信息偏好有所偏移。
第三個維度是用戶特征
包括各種興趣標(biāo)簽,職業(yè)、年齡、性別等,還有很多模型刻畫出的隱式用戶興趣等。
結(jié)合三方面的維度,模型會給出一個預(yù)估,即推測推薦內(nèi)容在這一場景下對這一用戶是否合適。
頭條指數(shù)“根據(jù)今日頭條熱度指數(shù)模型,將用戶的閱讀、分享、評論等舉動的數(shù)量加權(quán)求和得出響應(yīng)的事件、文章或關(guān)鍵詞的熱度值”,考慮了用戶的多種舉動,它具有輔助創(chuàng)作、輿情分析和精準(zhǔn)營銷三個重要作用,目前的頭條指數(shù)的更新是按照小時更新的,相對微信而言更及時,同時還能夠提供數(shù)據(jù)下載。
除了熱度,頭條指數(shù)還提供用戶畫像的分析功能。對相關(guān)關(guān)鍵詞匹配的人群,包括性別、年齡、地域、愛好都有直觀的呈現(xiàn)。選擇特定的時間段,還能回溯某段時間中響應(yīng)的數(shù)據(jù)體現(xiàn)。
內(nèi)容分析包括文本分析,圖片分析和視頻分析。頭條一開始主要做資訊,今天我們主要講一下文本分析。文本分析在推薦系統(tǒng)中一個很重要的作用是用戶興趣建模。沒有內(nèi)容及文本標(biāo)簽,無法得到用戶興趣標(biāo)簽。另一方面,文本內(nèi)容的標(biāo)簽可以直接幫助推薦特征。
內(nèi)容分析和用戶標(biāo)簽是推薦系統(tǒng)的兩大基石。內(nèi)容分析涉及到機(jī)器學(xué)習(xí)的內(nèi)容多一些,相比而言,用戶標(biāo)簽工程挑戰(zhàn)更大。
今日頭條常用的用戶標(biāo)簽包括用戶感興趣的類別和主題、關(guān)鍵詞、來源、基于興趣的用戶聚類以及各種垂直興趣特征(車型,體育球隊,股票等)。還有性別、年齡、地點(diǎn)等信息。性別信息通過用戶第三方社交賬號登錄得到。
還有用戶的年齡信息通常由模型預(yù)測,通過不同機(jī)型、閱讀的時間分布等預(yù)估。常駐地點(diǎn)來自用戶授權(quán)訪問位置信息,在位置信息的基礎(chǔ)上通過傳統(tǒng)聚類的方法拿到常駐點(diǎn)。常駐點(diǎn)結(jié)合其他信息,可以推測用戶的工作地點(diǎn)、出差地點(diǎn)、旅游地點(diǎn)。這些用戶標(biāo)簽非常有助于推薦。