分析搜索引擎的三大核心問題 對網站優化有何幫助
搜索引擎可算是當今互聯網中應用技術含量非常高的產物,雖然它們的應用形式非常簡單,但卻為了給億萬互聯網用戶提供準確快速的搜索結果,涉及到很多技術工具。作為SEOer,或許我們不用考慮搜索引擎的技術,但我們還是需要了解他們到底在研究哪些問題?
搜索引擎的三大核心問題
核心問題一:搜索引擎相關性技術
搜索引擎要準確判斷用戶查詢詞與頁面的相關性,就需按相關性強弱完成頁面集合的初步篩選和排序。
關於相關性的分類
1.查詢詞的相關性
搜索引擎首先就要判斷用戶查詢詞的語義,因為同一個詞在不同的場景上有不同的意思,只有正確判斷語義,才能更好地去匹配相關性強的頁面。如果判斷錯誤,造成搜索結果頁面完全不是用戶所需的內容,就會大大降低用戶的搜索體驗。
2.用戶相關性
用戶看過哪篇文章和進入哪個網站,在搜索某個詞時,這篇文章和這個網站會有不一樣的排名。又或者某用戶是某個領域的專家或是經常關注這方面的愛好者,當他搜索這個領域的某些詞時,他的多次進入也會使網站排名產生積極的作用。
這就是SEO優化當中常說的個性化搜索。
3.檢索模型
為了檢索頁面與用戶搜索詞的相關性,搜索引擎研究人員研究出各種檢索模式,其中「TF-IDF」是大家最熟悉的檢索模式之一。TF-IDF的核心概念是一定程度上增加TF(關鍵詞頻率或密度)和IDF(關鍵詞的反文檔頻率)的值,最終得到的兩者成績就是判斷頁面相關性的值。也就是,增加關鍵詞頻率或密度,找尋百度相關搜索結果數小的詞。
核心問題二:搜索引擎評價技術
如果說相關性研究僅僅是最初的篩選和排序,那麼要達到用戶的真正期望,就需要通過搜索引擎評價技術來完成。
① 用戶點擊生成的日誌數據
搜索引擎會將用戶點擊的數據在後台記錄,生成大量的日誌數據,再利用這些數據對搜索引擎進行評價。
② 搜索引擎評價的方法
最常用的評價方法就是Cyril Cleverdon,其指標有兩種:
準確率:指檢索出來的文檔中相關文檔所佔比例。
召回率:指全部文檔中中被檢測出來的文檔比例。
三、搜索引擎用戶搜索體驗技術
搜索引擎是面向用戶的,所以用戶搜索體驗是判斷搜索引擎好壞的重要之一。搜索引擎通過數據可以分析哪些頁面或網站的用戶搜索體驗好,提升其排名或網站權重;如果做得不好的頁面或網站,則降低其排名或整站權重。
了解搜索引擎的核心問題,就能在優化網站的過程,提高網站體驗度,使網站獲得更好的排名,這樣對PV、UV等數據提升也有很大的網站。