昆明網站優化也談中文分詞技術應用

閱讀 ?·? 發布日期 2018-11-05 08:42 ?·? admin

昆明網站優化也談中文分詞技術應用
分詞技術就是當用戶提交一個關鍵詞串給搜索引擎查詢的時候,搜索引擎要對這個關鍵詞串做一系列的匹配處理的一個技術方法。
  搜索引擎查詢處理方法
1、如果關鍵詞不超過三個中文的話就直接到數據庫索引詞匯里面查找,超過了三個中文漢字的話就用空格,逗號等分割開來。將用戶提交的關鍵詞串分割成若干個詞來查詢。
2、另外再查看這個詞有沒有重復的詞匯,有的話會省略掉。
3、分詞技術發展到目前已經很成熟的了,google是購買第三方公司的分詞技術,百度是自己開發的分詞技術,在中文分詞這塊百度要稍稍領先于google。英文的詞與詞之間是用空格隔開的。

相關排序和搜索引擎 中文分詞十年回顧
搜索引擎把跟用戶提交的關鍵詞最相關的網頁呈現出來,我們看到百度“XX頁”現象就是這個問題,因為把所有的網頁都做排名的話沒有多大意思,用戶只要最相關的那部分就可以了。也可以叫相關排序。
我們在做關鍵詞分析的時候盡可能用相關度比較高的長尾關鍵詞來做也是基于這點理論。
  1、分詞技術利用字符串匹配的分詞方法可以分為三大類:
  第一種正向最大匹配法,從閱讀習慣左到右分詞。
  第二種反向最大匹配法,跟第一種反過來,從右到左。
  第三種最少關鍵詞分詞法,就是說把一句話盡可能分出少幾個關鍵詞。
  搜索引擎一般會是上面的三種方法組合起來使用,盡可能減少分詞中的錯誤率,為用戶提供匹配度最高的網頁信息。
分詞技術的好處:
1、可以隱藏你網站的流量,別人不知道你還從“其它詞”來流量,可以讓競爭對手捉摸不透。
2、當網站上線幾個月,目標關鍵字3-5個都優化上來啦,想改標題就難啦,輕者降權,重則都不用我多說大家都知道的。進退兩難,所以在網站剛上線的時候就規劃好你的目標關鍵字。
我的網站目標關鍵字可以分詞嗎,怎么分,能分多少個,分出來的怎么優化給網站帶來流量,但是有的分出來是沒有用的,像上面的舉例,根據網站自身的內容來判斷。
我們用為什么要做標題TItle分詞:
1、百度標題里規定只能寫25個字(寫多了百度不認賬),超過25個就用…表示;
2、所以我們要在25個字中盡可能地分出更多的詞;
3、分出更多的詞,就有機會獲得排名,就創造了更多的流量;
總結:分出來的詞越多,排名的機會就越多,相對應的流量就越多。