當前位置:
首頁 > 最新 > 5年SEO實戰大牛乾貨分享:演算法解讀之動態索引對SEO的幫助

5年SEO實戰大牛乾貨分享:演算法解讀之動態索引對SEO的幫助

魔貝課凡

一個IT互聯網人的知識分享基地

生活在陰溝里,

依然有仰望星空的權利。

—王爾德

上一篇文章講到倒排索引的靜態索引,那這篇文章我們來聊聊動態索引。因為一旦索引建立好後,那麼就能投入到用戶的查詢請求系統中。

實際上在互聯網中每時每秒都有大量的頁面生成,為了滿足用戶的不同需求,必須要加入最新的文檔返回給用戶,比如:小明,在百度上查詢了「今日南京天氣預報」,如果按照靜態索引的話,返回的信息就不是最新的,可能是今天以前的天氣預報信息。從用戶的體驗上來說並不是很好,那麼動態索引就很好的解決了這一問題。

在原始的靜態索引庫搭建好之後,源源不斷的會有新的文檔加入進來,同時在原先的文檔索引中可能會被刪除或者內容被更改。比如:在視頻軟體客戶端上看某個電視劇或者是電影,視頻軟體會一邊下載一邊播放,當觀看一個新的視頻時,緩存庫中會有該視頻的緩存文件,搜索引擎也是一樣的,需要及時的將新的文件納入到緩存庫中。刪除該視頻的緩存也是實時可以看得見的,大多數搜索引擎也是類似於這樣的動態場景。

那麼搜索引擎具體是怎麼實現這種動態索引的呢?老規矩我們先來了解一下名詞概念:

1、倒排索引:這其實是單詞對應文檔的一種存儲形式。

2、臨時索引:也是一種存儲形式,和倒排索引不同的是,比如有新的文檔加入到系統中,實時的對文檔進行分析,並加入到臨時的索引的存儲形式中。

3、已刪除文檔列表:這個很好理解就是用來存儲被刪除文檔的對應ID後,所形成的一個ID列表。PS,如果一篇文檔的內容被更改了,搜索引擎就會認為不存在舊的文檔了,會將它刪除掉,然後在系統里增加新的文檔,通過這樣的方式來實現對內容更改的支持。

當搜索引擎發現了一個新的文檔時(互聯網上的所有文件叫做文檔,比如jpg,txt,js等等這些都是文檔),都會把它放到臨時的緩存索引庫中。當有文檔被刪除或者更改之後,會把它放在刪除隊列,抓取更新後的文檔信息,通過臨時的緩存索引庫中,來實現一個動態的索引。

舉個例子:一個用戶在百度搜索某個查詢詞的時候(等於是向搜索引擎發送了一個請求),搜索引擎會在自己的倒排索引庫中和臨時緩存索引庫中,找到與用戶查詢詞相關的文檔集合,同時將兩個庫中的文檔集合進行篩選整合,最後得出相關的文檔,並在搜索結果頁上返回這些文檔集合。

在實際中,網站所在的伺服器資源是有限的,隨著時間的推移,越來越多的文檔被加入到這個系統中,臨時緩存索引庫的內存也會被消耗,可能在最初分配給臨時緩存索引庫的內存已經不能夠滿足現在的要求了。搜索引擎通過4種更新的策略完美的解決了這個問題,分別是:完全重建策略、再合併策略、原地更新策略、混合策略,這些就不再深度講解了。

實戰中的應用,通過上面的結論,當我們的網站文章頁面被收錄後,排名不是很理想,那這個時候是刪除這個頁面,然後重新寫一個新的關於這個詞的文章嗎?

並不是,正確的做法應該是修改原網頁的內容,讓這個頁面豐富度更加的完善(比如圖文並茂、文章的排版布局、重點的話語加粗、加入時間戳、分享插件、評論等等),然後在百度站長平台上提交了鏈接並且投訴這個網頁的快照。刪除這個頁面不好么?也可以,但刪除URL並不是首選,因為刪除這個頁面後就變成了死鏈接。

而針對死鏈接,這裡有兩種情況:一班的seo從業者如果細節做的不到位的話,就不會管它了,任憑網站上存在死鏈接,這其實對於蜘蛛的友好度不利,也會導致網站的整體分值下降,對網站的排名非常的不利。那麼二班的seo從業者可以很好的利用相關工具(比如:尖叫青蛙、綠蝸牛等等工具)抓取網站的死鏈接,並且提交到百度站長平台上面,但是搜索引擎的更新並不是很及時而且有時候即使收錄了也會放出來,舉個例子:網站雙收錄後,做了301跳轉也要1-3個月才能生效,所以在原網頁上修改是最好的選擇,這次分享就到這裡,歡迎在評論區留言。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 魔貝課凡 的精彩文章:

還在用site看網站收錄的seoer,來膜拜我!

TAG:魔貝課凡 |