當前位置:首頁 >  站長 >  搜索優(yōu)化 >  正文

SEO優(yōu)化重點理解百度谷歌搜索引擎索引流程

 2013-06-26 16:04  來源: 廈門seo   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

概要:主要圍繞著SEO優(yōu)化重點理解百度谷歌搜索引擎索引流程理論分解,索引是搜索引擎里面很重要重點一部分,希望廣大愛好者們時時關注我更新文章,因為我是按步驟來理解SEO優(yōu)化淺到深,如前面沒關注就直接看這部分可能理解起來有點難度.不過前面很理解這部分我相信也好理解.理解因人而異。希望大家能理解讀懂SEO優(yōu)化所有內容部分。重復說下搜索引擎有四大部分:1、抓取,2、過濾,3、索引 ,4、查詢,今天講解到索引部分有以下幾點內容:注意:索引(主要關于“相關性”的一個概念了,所謂的“預處理”)

一、提取文字內容:搜索引擎是對文字處理比較強,其次圖片、視頻等其他處理比較弱,理解:我們在站內和站外更新文章時候一定要以文字為主,沒辦法情況下才發(fā)其他內容.

二、停止詞:什么叫停止詞我們可以理解成講話停頓出現(xiàn)的那個詞就叫停止詞,如你在哪里啊,你在干嘛呀,我的SEO優(yōu)化, 等等,“啊”“呀”“的” “等”出現(xiàn)網(wǎng)頁和互聯(lián)網(wǎng)網(wǎng)頁中最多次數(shù)不會被索引(寫軟文注意事項)

三、消躁:這兩個詞我們可以先有現(xiàn)實生活中理解他,消:消失,消除,躁:躁動因急躁而行動,躁汗心煩急躁,導致汗出,躁狂浮躁輕狂, 我們就知道搜索引擎索在提取你網(wǎng)頁時先提取標題在提取文章內容給予比較高分數(shù),而網(wǎng)頁文章以外內容會給予比較低分數(shù),如你想把關鍵詞排名好分數(shù)高盡量出現(xiàn)在文章頁里面,(站內和站外注意事項)

四、中文分詞:里面有切詞,正向匹配,逆向匹配,雙向最大匹配,詞庫:切詞就是詞與詞之間把他分開來讀,因搜索引擎只讀一個詞,在切詞分開時搜索引擎有他切法,就是把詞與詞之間相關性用正向匹配在用逆向匹配以及雙向最大匹配得出來你文章內容相關性和可讀性.稍微解釋下:正向匹配:就是順著詞的組詞在組詞組詞成語,逆向匹配:也是一樣組詞在組詞組詞成語.雙向最大匹配:有些詞可正配也可逆配,詞庫:就是百度谷歌有他自己詞典,來分析你網(wǎng)站網(wǎng)頁文章中相關性(站內和站外文章相關性)

五、提取關鍵詞信息:理解:搜索引擎提取所有互聯(lián)網(wǎng)中網(wǎng)頁關鍵詞相關文章來進行對比,如網(wǎng)站網(wǎng)頁信任度高分數(shù)高投票人多關鍵詞合理安排又相關性強從而會把你頁面排在比較靠前排名。

六、去重:理解:網(wǎng)頁中重復在重復,搜索引擎檢測你網(wǎng)頁文章中太對不自然關鍵詞

七、倒排索引(介紹正排與倒排):正排(以網(wǎng)頁文件為主,以關鍵詞為集合暫時儲存數(shù)據(jù)庫,倒排(以關鍵詞為主,以網(wǎng)頁文件為集合)數(shù)據(jù)庫為準

八、鏈接計算(分值與相關性)外鏈/內鏈:網(wǎng)站網(wǎng)頁盡可能跟文章內容有一定相關性 搜索引擎檢計算出鏈接文章相關性強而得到較高分值。

九、頁面過濾:就是搜索引擎會把所有互聯(lián)網(wǎng)中網(wǎng)頁文章內容進行對比如你網(wǎng)站網(wǎng)頁內容是抄襲有可能會過濾掉不索引到數(shù)據(jù)庫中,而那些信任度高

十、頁面指紋(空間相量概念)搜索引擎提取網(wǎng)頁文章進行MD5加密處理對比判斷文章原創(chuàng)(信任度高網(wǎng)站網(wǎng)頁會覺得你原創(chuàng)度高),百度谷歌判斷文章原創(chuàng)不原創(chuàng)是用方向詞的方向相量和大小力量進行分析得出結果.可以理解成 方向網(wǎng)頁與網(wǎng)頁進行對比看誰相似度高,大小力量是計算文章的內容相差大和相關性越強越原創(chuàng).

以上是我個人見解和理解分析出來原理知識分享給廣大SEO優(yōu)化人員和程序員技術交流,更多技術技巧請到我博客進行互相交流地址:,轉載請保留地址,寫一篇文章不易,希望大家支持原創(chuàng),后續(xù)我更加堅持每天寫幾篇SEO優(yōu)化技術技巧文章分享.

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 百度谷歌同推feed流,背后到底是何邏輯?

    雖然兩者在feed流技術方面可以說是“同源”,產品也有眾多相似之處,但是如果對比百度與谷歌在feed流產品的細節(jié),還是能夠發(fā)現(xiàn)兩者之間有諸多的不同。

  • 百度站長平臺:搜索引擎索引系統(tǒng)概述

    眾所周知,搜索引擎的主要工作過程包括:抓取、存儲、頁面分析、索引、檢索等幾個主要過程。過去幾周給大家介紹了抓取相關的簡要過程。今天簡要介紹一下索引系統(tǒng),以億為單位的網(wǎng)頁庫中查找特定的某些關鍵詞猶如大海里面撈針,也許一定的時間內可以完成查找,但是用戶等不起,從用戶體驗角度我們必須在毫秒級別給予用戶滿意

  • 趣:百度谷歌360三家競價客服對比

    搜索引擎是一個重要的互聯(lián)網(wǎng)工具,雖然微博微信等新媒體大行其道,但是搜索引擎依然能夠掌控很大部分互聯(lián)網(wǎng)流量。有流量的地方就會有廣告,就像有人流的地區(qū)就會有買賣一樣。廣告也是搜索引擎最主要的盈利模式,其中搜索廣告又是其中的主角。搜索廣告即是競價,是一種比較殘酷的盈利模式,天花板很高很高,因為廣告費會隨著

    標簽:
    百度谷歌
  • 百度谷歌360搜狗四大搜索引擎新站排名優(yōu)化研究

    即我的第一篇片文章《從網(wǎng)站的孕育到經營對待網(wǎng)站就想對待孩子一樣》以及隨后的第二篇文章《寫給和我一樣——在新站建設路上的新站長們》發(fā)表后,經過了2個月左右的網(wǎng)站優(yōu)化,結合這次的實際經驗,給大家分享下目前國內常用四大搜索引擎對新站的關鍵詞排名的研究,筆者是自建站,自己優(yōu)化。話不多說,直接進入正題。先說說

    標簽:
    百度谷歌
  • 近期對百度谷歌排名變動的猜想

    最近不少站長抱怨:百度優(yōu)化更難做了,堅持幾個月網(wǎng)站靜若處子,排名紋絲不動;谷歌新算法又來了,太多網(wǎng)站迎接超強臺風。這里是近期百度、谷歌網(wǎng)站排名情況的一點小感悟。

    標簽:
    百度谷歌

熱門排行

信息推薦