信息摘要:
事件營(yíng)銷(xiāo)之百度事件脈絡(luò)的算法詳解:百度事件脈絡(luò)在關(guān)鍵詞上的展示會(huì)隨著事件的轉(zhuǎn)發(fā)量而增加,當(dāng)然,如果事件的熱度下降了,展現(xiàn)的廣度也會(huì)隨著縮小。新聞事件距離,新聞集合去噪,時(shí)間片類(lèi)聚,代表新聞選取,可以輕輕松松的了解到整個(gè)事件發(fā)展的全過(guò)程,有效的提高獲取
如果你在百度之中輸入“黃海波”、“巴西世界杯”等熱門(mén)詞匯時(shí)會(huì)發(fā)現(xiàn),右側(cè)首次出現(xiàn)一條時(shí)間軸信息圖,這就是事件脈絡(luò)。這是百度新推出的一種搜索效果,它是按照時(shí)間的順序?qū)⒄麄€(gè)事件的發(fā)展過(guò)程,按照時(shí)間軸的組織方式呈獻(xiàn)給用戶(hù),讓用戶(hù)迅速的掌握一個(gè)事件的來(lái)龍去脈。
百度事件脈絡(luò)在關(guān)鍵詞上的展示會(huì)隨著事件的轉(zhuǎn)發(fā)量而增加,當(dāng)然,如果事件的熱度下降了,展現(xiàn)的廣度也會(huì)隨著縮小。下面,讓我們朗創(chuàng)網(wǎng)絡(luò)營(yíng)銷(xiāo)一起來(lái)了解一下百度事件脈絡(luò)的算法:
新聞事件距離:在新聞發(fā)布高峰期間隔1小時(shí),要比在新聞發(fā)布的低谷期間隔一小時(shí),造成的時(shí)間跨度更長(zhǎng)。一般上午是新聞發(fā)布的高峰,下午兩點(diǎn)到四點(diǎn)也是。對(duì)不同時(shí)間段的新聞發(fā)布數(shù)量進(jìn)行統(tǒng)計(jì),可以幫助到后續(xù)的時(shí)間片聚類(lèi)。
新聞集合去噪:不同媒體對(duì)事件的報(bào)到的時(shí)效性是不一樣的,進(jìn)行時(shí)間片聚類(lèi)之前,還應(yīng)該去除掉相似的新聞,為了避免同一類(lèi)新聞太過(guò)相似,比較特征向量,利用該特征向量,如果新聞集合太大,就應(yīng)該利用站點(diǎn)的權(quán)威性進(jìn)行過(guò)濾。
時(shí)間片類(lèi)聚:每一篇新聞,抽取發(fā)布時(shí)間;根據(jù)發(fā)布時(shí)間,把一個(gè)新聞事件集合內(nèi)的新聞進(jìn)行排列。將新聞按照發(fā)布時(shí)間投放到時(shí)間軸上,如果事件的發(fā)展比較明顯,就能在時(shí)間軸上看到一些新聞比較密集的區(qū)域,這個(gè)區(qū)域就是我們想要獲得的新聞發(fā)展的個(gè)個(gè)階段。
代表新聞選?。?/strong>新聞來(lái)源的站點(diǎn)的權(quán)威性如何,該新聞是否在第一時(shí)間進(jìn)行發(fā)布,新聞的轉(zhuǎn)載量如何等等。
通過(guò)對(duì)具體例子進(jìn)行分析我們也可以發(fā)現(xiàn)事件脈絡(luò)中展現(xiàn)的額信息發(fā)布日期,即時(shí)間脈絡(luò)中的日期,誤差多不會(huì)超過(guò)一天;發(fā)布時(shí)間一般會(huì)集中在早上8點(diǎn)~11點(diǎn),以及下午13~16點(diǎn)且轉(zhuǎn)發(fā)量較大,基本在500以上。
事件脈絡(luò)是以時(shí)間為主線(xiàn)的方式來(lái)進(jìn)行呈現(xiàn)的,這樣用戶(hù)就不用再自我梳理,可以輕輕松松的了解到整個(gè)事件發(fā)展的全過(guò)程,有效的提高獲取信息的效率,并且對(duì)用戶(hù)進(jìn)行深入引導(dǎo)。
搜索引擎的目的在于滿(mǎn)足人們的需求,能夠更好地對(duì)搜索結(jié)果進(jìn)行匹配與分類(lèi),與用戶(hù)之間形成完美的互動(dòng),這就是搜索引擎發(fā)展的大趨勢(shì)。