當(dāng)前位置:首頁(yè) >  站長(zhǎng) >  搜索優(yōu)化 >  正文

網(wǎng)站在優(yōu)化過(guò)程中頁(yè)面抓取過(guò)程簡(jiǎn)述

 2018-11-07 08:43  來(lái)源: 用戶投稿   我來(lái)投稿 撤稿糾錯(cuò)

  域名預(yù)訂/競(jìng)價(jià),好“米”不錯(cuò)過(guò)

url,即統(tǒng)一資源定位符,通過(guò)對(duì)url的分析,我們可以更好地理解頁(yè)面抓取過(guò)程。今天,小小課堂SEO學(xué)網(wǎng)帶來(lái)的是《頁(yè)面抓取過(guò)程簡(jiǎn)述》。希望本次的SEO技術(shù)培訓(xùn)對(duì)大家有所幫助。

一、url是什么意思?

URL,英文全稱為“uniform resource locator”,中文譯為“統(tǒng)一資源定位符”。

在網(wǎng)站優(yōu)化中要求每一個(gè)頁(yè)面有且僅有一個(gè)唯一的統(tǒng)一資源定位符(URL),但往往很多網(wǎng)站同一頁(yè)面對(duì)應(yīng)了很多個(gè)URL,如果都被搜索引擎收錄且未做URL轉(zhuǎn)向,就會(huì)產(chǎn)生權(quán)重不集中的情況,通常稱為URL不規(guī)范。

二、url的組成

統(tǒng)一資源定位符(URL),由三部分組成:協(xié)議方案、主機(jī)名和資源名。

例如:

https:// www.x**.org /11806

其中https為協(xié)議方案,www.***.org 為主機(jī)名 ,11806為資源,不過(guò)這個(gè)資源不太明顯,一般資源后綴為.html,當(dāng)然還可以是.pdf、.php、.word等格式。

三、頁(yè)面抓取過(guò)程簡(jiǎn)述

無(wú)論是我們平時(shí)用的互聯(lián)網(wǎng)瀏覽器,還是網(wǎng)絡(luò)爬蟲(chóng),雖然是兩種不同的客戶端,但獲取頁(yè)面的方式卻是相同的。頁(yè)面抓取過(guò)程如下:

① 連接DNS域名系統(tǒng)服務(wù)器

客戶端都會(huì)先連接到DNS域名服務(wù)器上,DNS服務(wù)器將主機(jī)名( www.***.org )轉(zhuǎn)換為IP地址,并反饋給客戶端。

PS:本來(lái)我們通過(guò)111.152 . 151.45 的地址來(lái)訪問(wèn)某網(wǎng)站,為了方便記憶和使用,才利用DNS域名系統(tǒng)轉(zhuǎn)換為了 www.***.org 。這也就是DNS域名系統(tǒng)的作用。

② 連接IP地址服務(wù)器

該IP服務(wù)器下可能會(huì)有很多程序(網(wǎng)站),可以通過(guò)端口號(hào)來(lái)做區(qū)分,同時(shí)每個(gè)程序(網(wǎng)站)都會(huì)監(jiān)聽(tīng)端口是否有新的連接請(qǐng)求,HTTP網(wǎng)站默認(rèn)為80,HTTPS網(wǎng)站默認(rèn)為443。

不過(guò)通常情況下,端口號(hào)80和443是默認(rèn)不出現(xiàn)的。

舉例來(lái)講:

https://www.***.org:443/ = https://www.***.org/

http://www.***.org:80/ = http://www.***.org/

③ 建立連接并發(fā)送頁(yè)面請(qǐng)求

客戶端與服務(wù)器建立連接后,會(huì)發(fā)送頁(yè)面請(qǐng)求,通常為get,也可以是post。

get 11806 HTTPS/1.0

獲取HTTPS協(xié)議下的頁(yè)面11806 返回給客戶端。之后如需繼續(xù)獲取更多頁(yè)面,則發(fā)送其他請(qǐng)求,否則將關(guān)閉該連接。

PS:通常情況下 ,/seo/11806.html 可能會(huì)更清晰。也就是發(fā)送 https://www.***.org/ 下的 seo文件夾下的 11806.html 的頁(yè)面請(qǐng)求。

以上就是小小課堂SEO自學(xué)網(wǎng)帶來(lái)的是《頁(yè)面抓取過(guò)程簡(jiǎn)述》。感謝您的觀看。網(wǎng)絡(luò)營(yíng)銷培訓(xùn)認(rèn)準(zhǔn)小小課堂!SEO培訓(xùn)認(rèn)準(zhǔn)小小課堂!更多seo教程搜索小小課堂。原創(chuàng)文章歡迎轉(zhuǎn)載并保留版權(quán):https://www.xxkt.org/

申請(qǐng)創(chuàng)業(yè)報(bào)道,分享創(chuàng)業(yè)好點(diǎn)子。點(diǎn)擊此處,共同探討創(chuàng)業(yè)新機(jī)遇!

相關(guān)文章

  • 網(wǎng)站靜態(tài)url優(yōu)化:更改網(wǎng)站url會(huì)影響seo排名嗎

    什么是靜態(tài)url,什么是動(dòng)態(tài)url,靜態(tài)url與動(dòng)態(tài)url的區(qū)別是什么,網(wǎng)站為什么要設(shè)置靜態(tài)url,而非動(dòng)態(tài)url,靜態(tài)url的優(yōu)勢(shì)是什么,一個(gè)網(wǎng)站真的可以做到全靜態(tài)url嗎,下面帶你詳細(xì)了解什么是靜態(tài)url。

    標(biāo)簽:
    url優(yōu)化方法
  • 如何合理應(yīng)用URL規(guī)則 間接提升網(wǎng)站排名

    其實(shí)URL對(duì)于用戶來(lái)說(shuō)比較重要,而對(duì)于SEO來(lái)說(shuō)也是一種用戶體驗(yàn)和優(yōu)化方式,因?yàn)閁RL規(guī)則對(duì)排名也會(huì)有少許影響。正因?yàn)槿绱?,我們才?huì)更重視URL的編寫(xiě)規(guī)則,所以,在URL編寫(xiě)過(guò)程中,一定要注意以下幾個(gè)方面

    標(biāo)簽:
    url
    url優(yōu)化方法
  • URL優(yōu)化需要注意什么?URL優(yōu)化的幾個(gè)注意事項(xiàng)

    在網(wǎng)站建設(shè)的初期,在對(duì)網(wǎng)站整體架構(gòu)和層次的搭建之后,我們應(yīng)該合理的再做好URL優(yōu)化的工作,那么URL優(yōu)化需要注意什么?下面小編就為大家介紹URL優(yōu)化的幾個(gè)注意事項(xiàng),來(lái)看看吧

    標(biāo)簽:
    url優(yōu)化方法
  • 在建設(shè)url時(shí)到底需要注意哪些問(wèn)題???

    URL在百科里面的解釋就是統(tǒng)一資源定位符,其實(shí)說(shuō)簡(jiǎn)單點(diǎn)就是網(wǎng)頁(yè)地址,有的站長(zhǎng)可能會(huì)說(shuō)一個(gè)網(wǎng)址有什么需要注意的,但是我想說(shuō)別小看這個(gè)URL,選擇對(duì)的話它對(duì)網(wǎng)站優(yōu)化可以起到至關(guān)重要的作用,那么優(yōu)化時(shí)我們應(yīng)該注意哪些問(wèn)題呢,現(xiàn)在我就給大家講解一下

    標(biāo)簽:
    url優(yōu)化方法
  • 網(wǎng)站URL路徑如何設(shè)置更有利于SEO優(yōu)化?網(wǎng)站URL路徑的優(yōu)化要從簡(jiǎn)

    關(guān)于網(wǎng)站URL的路徑優(yōu)化,因?yàn)檫@算是比較基礎(chǔ)的知識(shí),但大多數(shù)朋友讓筆者診斷網(wǎng)站,不難看出很多SEO朋友都在基礎(chǔ)上出了問(wèn)題,尤其是在網(wǎng)站上線的前期,做好網(wǎng)站URL的路徑優(yōu)化可謂是重中之重,那么網(wǎng)站URL路徑如何設(shè)置更有利于SEO優(yōu)化?下面帶來(lái)網(wǎng)站URL路徑的優(yōu)化要從簡(jiǎn)

    標(biāo)簽:
    url優(yōu)化方法

熱門(mén)排行

信息推薦