當前位置:首頁 >  站長 >  網站運營 >  正文

采集程序設計經驗交流(一) 前言

 2009-04-05 21:55  來源:   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

“小網站本不需要維護,只是因為你的程序太笨了,所以你成了無休止的網站維護者。”—沉默的海

前言

經常有朋友在Q群(75604923)里問起采集的相關問題,每次針對個人回答的時候,總是無法說得很全面,很多朋友表示不滿意,今天發(fā)表此文,詳細介紹一下采集程序的設計思路。其實“沉默的海”本是一名業(yè)余ASP愛好者,ASP綜合技術水平應該說是一個“二把刀”。但對于采集程序的編寫,應該說還有點研究,因為我是因為采集程序才迷上編程、迷上ASP,也是從這里開始了自己的編程之路。

一、 采集程序的作用。

這個問題也許不用多說,每個站長可能都感覺特別的需要,因為我們精力必竟有限,不象那些大的網絡公司,有專門的新聞記者和網絡寫手。這樣以來,要想使自己的網站內容豐富起來,借簽別的網站上的內容無疑成了一個最好的辦法,也就是這個原因,數(shù)以千計的站長不知不覺中成了“復制粘貼”的操作手,在和站長朋友的聊天中得知,多數(shù)站長每天做的工作就是“復制粘貼”。這是一個多么枯燥的工作啊,但,為了自己的希望也不得不去做這些最讓人討厭的事情。

這樣以來,采集程序成為站長們必不可少的一個工具,給站長們帶來了很多的便利,即使我們的網站內容得到了豐富,又節(jié)省了很多的精力和時間。(和也許可以作為采集程序示例網站,無需要任何更新,網站永遠都是新的。)

但,有多站長卻又不會自己設計采集程序,從網上下載的程序要么是收費的,要么是功能不全的,往往不能讓人滿意。即便是收費的,用起來也不是十分方便,因為需要很多手工的操作。

“沉默的海”認為:采集程序要想真正發(fā)揮其方便快捷的優(yōu)勢,最好的一個辦法是針對自己的網站量身設計,而后和網站集成在一起,成為網站的一部分,只有這樣,才能算是一個成功的采集程序。

可是,采集程序怎么做呢?難嗎?

二、 采集程序怎么做。

“沉默的海”認為,采集程序設計一點都不難,只要有一些ASP編程常識,我覺得一天之內學會它,是沒有問題的。(相信我的話,你就把文章看完,我保證不會讓你失望;不相信我的話也請你看完,我保證看完后你會相信我的話。)

采集程序的基本原理其實很簡單:包括兩個步驟:

1、 下載目標網頁;

大家知道,采集程序幫我們做的工作其實就是“復制和粘貼”,那么要把一個網站復制下來,首頁你需要把網頁打開啊,這個過程其實就是下載目標網頁,只不過我們不是人工下載,而是利用程序來完成它。

這里有“核心技術”:XMLHTTP,它可以把網頁下載以備下一步的使用。

2、 提取網頁中我們需要的內容;

上一步我們完成了第一步:下載網頁。

但并不是所有下載的內容都是我們需要的,所以還要做的工作就是,提取我們需要的內容,去除不需要的,存入數(shù)據庫。這一步的主要技術是:正則表達式。

三、 做什么樣的采集程序。

做了以上兩步,應該說一個完整的采集程序已經完成了。它可以采集到我們需要的內容,而后存入數(shù)據庫,供我們使用??墒?,這是我們真正需要的嗎?顯然不是,因為我們既然要用采集程序來支持我們的網站,那就要用它來完成幾乎所以的工作。我認為:如果你的網站加了采集程序,那么即使長年不維護,網站依然是新的,這樣才算是成功的。

上面的采集程序顯然做不到,因為你還得啟動采集程序,然后把數(shù)據導入網站的數(shù)據庫,然后生成html,等等等等,還有很多工作需要我們來做。我們理想中的采集程序是不需要人工來做任何工作的,所以在完成采集程序之后我們還要做一些配套的程序,以保證采集程序的運行,和與網站的完美集成。

1、 自動啟動采集程序;

2、 將采集數(shù)據直接寫入網站數(shù)據庫;

3、 配套生成html等后續(xù)工作。

做了以上三點,我們才可以說自己做了一套還算可以的采集程序,那么我們具體應該怎么做呢,請看《采集程序設計經驗交流(二)—下載網頁》。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 經驗交流:提升站內用戶體驗度,從網頁設計開始!

    網站作為提供信息及服務的平臺,頁面的用戶體驗十分重要。合理的設計網站頁面布局可以有效的提高用戶體驗。通常的網站頁面層次模型分為網站首頁、網站內頁(欄目頁面和內容頁),有的網站還會因需要設計專題頁面。良好的頁面布局及代碼優(yōu)化對用戶體驗的提升起積極的促進作用,當然一個渾然天成的頁面感觀對SEO來說也是一

  • 網站經驗交流之地方網站出路在何方

    在過去幾年,由于一些站長們愛跟風,受門戶熱的影響,先后投入到網站中來,希望通過建設一個類似信息的網站來獲取利潤。但這些年,由于網站提供的信息價值

  • 提高百度快照的經驗交流

    最近拿到一個新網站,簡單的分析了一下,百度權重不高,首頁快照是半個月之前的,收錄也很少,外鏈倒是很多,因為之前做過谷歌的優(yōu)化。上網查了一下百度快照更新的六個因素,主要是下面幾點:

    標簽:
    經驗交流
  • 個人經驗交流:小談數(shù)字域名諧音推廣

    一個網站如果擁有好的域名,那么推廣起來就簡單容易許多。那么好域名的標準又是什么呢?好域名要以簡短、易懂、好記為原則。因此,域名若能夠與網站的品牌相一致,無疑更加有利于記憶。比如,淘寶的域名和品牌是一致的,都是“淘到好東西”的意思,這樣就

    標簽:
    經驗交流
  • 將流量轉為財富 6月12日深圳站長網商網媒經驗交流會報名中

    分享及交流主題:1、一家手機電子商務網站如何成為后來居上者,不到三年時間達到1.5億的年銷售額?2、B2C電子商務實踐中的痛與快樂,迷茫與出路?3、如何將現(xiàn)有的網站流量轉化成財富?網站聯(lián)盟、點擊成金!4、現(xiàn)場與嘉賓互動答疑。5、現(xiàn)場資

熱門排行

信息推薦