中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

Lynx瀏覽器在SEO上的應(yīng)用

2019-03-05    來源:SEM一家之言

容器云強(qiáng)勢(shì)上線!快速搭建集群,上萬Linux鏡像隨意使用

曾經(jīng)有朋友問我怎么才能判斷一個(gè)SEOer是不是高手。我就出了一個(gè)主意,就建議他問那個(gè)SEOer是不是知道Lynx在SEO上的應(yīng)用方法。這么來提問,其實(shí)能從一個(gè)側(cè)面反映這個(gè)SEOer對(duì)SEO研究有多深的。

現(xiàn)在SEO行業(yè),雖然有很多以訛傳訛的言論,但是如果自己經(jīng)常實(shí)踐,還是能找到很多真正有用的操作方法。實(shí)踐久了,也能判斷誰的說法正確,誰的說法有問題,這樣的SEOER,可以放心的讓他去操作一些比較重要的網(wǎng)站了。再進(jìn)一步的給網(wǎng)站各個(gè)細(xì)節(jié)優(yōu)化過程中,就會(huì)發(fā)現(xiàn)很多以前別人沒有談到過,也很難在優(yōu)化一些小網(wǎng)站的過程中注意到的細(xì)節(jié)。這些細(xì)節(jié),在別的地方很難找到相關(guān)的參考資料,或者根本就找不到。但是在google的《google網(wǎng)站質(zhì)量指南》、《google黑板報(bào)》、《google中文網(wǎng)站管理員博客》,基本上都可以找到關(guān)于這些細(xì)節(jié)的只言片語的。只不過那里面也只是給出了一個(gè)方向,更具體的細(xì)節(jié)還是要靠你自己再去實(shí)踐。

在《google網(wǎng)站質(zhì)量指南》 的第一頁 ,就已經(jīng)建議大家去用Lynx這個(gè)工具區(qū)檢測(cè)你的網(wǎng)站:

使用諸如 Lynx 的文本瀏覽器來檢查您的網(wǎng)站,因?yàn)榇蠖鄶?shù)搜索引擎信息采集軟件查看您網(wǎng)站的方式與 Lynx 幾乎一樣。如果諸如 Javascript、Cookie、會(huì)話 ID、框架、DHTML 或 Flash 等復(fù)雜功能造成您無法在文本瀏覽器中看到整個(gè)網(wǎng)站,則搜索引擎信息采集軟件在抓取您的網(wǎng)站時(shí)可能會(huì)遇到問題。

這里提到了“Lynx查看網(wǎng)站的方式和搜索引擎幾乎一樣的”。一個(gè)SEOer,如果真的到了很多細(xì)節(jié)都無法從別人那里獲取參考的程度,那這段話相信他很難忽視掉的。

我用了一段時(shí)間的Lynx,發(fā)現(xiàn)這個(gè)曾經(jīng)的文本瀏覽器和搜索引擎爬蟲很像的。你所聽過的爬蟲特性,在這里面都能找到一點(diǎn)影子。

比如檢測(cè)隱藏鏈接,我們只知道搜索引擎是不喜歡的,但是具體的檢測(cè)方法是怎么樣的呢? 如果你用熟了Lynx,就發(fā)現(xiàn)一個(gè)非常簡(jiǎn)單的命令就搞定了。

首先要搭建一個(gè)Lynx的運(yùn)行環(huán)境。Lynx不能用那種編譯過的在windows下運(yùn)行的版本,有很多功能是不能用的。建議在XP下裝一個(gè)虛擬機(jī),然后在虛擬機(jī)里裝一個(gè)linux系統(tǒng)來運(yùn)行Lynx。

虛擬機(jī)軟件用 VirtualBox 或者 VMWare,具體的安裝方法大家google之。 Linux系統(tǒng)推薦用Ubuntu,它可以在圖形界面上安裝lynx。

在裝了Lynx的Linux系統(tǒng)的命令模式下輸入:lynx -dump www.alibaba.com 并回車,這個(gè)頁面上的隱藏鏈接就一覽無余了。如:

檢測(cè)出了隱藏鏈接

然后再進(jìn)一步的分析一下,是哪些鏈接Lynx會(huì)認(rèn)為是隱藏鏈接呢?

可以看到,至少以下的一種鏈接是會(huì)被Lynx認(rèn)為是隱藏鏈接的。代碼為:

<a href=”http://www.alibaba.com”>  </a>

這個(gè)鏈接,即沒有文字作為錨文本,也沒有圖片或其他作為鏈接的對(duì)象。如果不去加載CSS文件或JS文件,光就這個(gè)代碼,在網(wǎng)頁上是看不到這個(gè)鏈接的存在的。當(dāng)然這就是隱藏鏈接,毫無爭(zhēng)議的。

這是Lynx認(rèn)為的情況,搜索引擎也是一樣的。從整個(gè)互聯(lián)網(wǎng)來看,這種檢測(cè)方法在99%的情況下都不會(huì)冤枉一個(gè)網(wǎng)站的。對(duì)于google來說,一個(gè)檢測(cè)方法,如果能有40%以上的反作弊效率,那是非常好的一個(gè)方法。

一個(gè)非作弊的網(wǎng)站,產(chǎn)生這種情況的原因,是因?yàn)榫W(wǎng)頁設(shè)計(jì)人員的一些“奇怪”的代碼寫法。如果你去檢測(cè)你的網(wǎng)站,說不定也能看到這些隱藏鏈接。

當(dāng)然,Lynx的作用不止這個(gè)。它首先是能以一個(gè)可視化的角度來展現(xiàn)爬蟲看到了什么內(nèi)容。用它可以挨個(gè)檢查你的網(wǎng)頁給搜索引擎爬蟲展現(xiàn)了怎么樣的內(nèi)容。如:

Lynx看到的內(nèi)容

然后才是其他的一些功能:

可以檢測(cè)網(wǎng)頁代碼的完整性。如果提示有“Bad HTML”就要注意一下。

可以和IE一樣查看源文件。 命令在附錄中。

對(duì)cookie的跟蹤是特別對(duì)待的。會(huì)提示你是不是跟蹤cookie。

對(duì)框架和表單的處理和爬蟲是一樣的。

URL太多參數(shù),會(huì)造成瀏覽困難。

可以查看網(wǎng)頁返回的http頭信息

……

你會(huì)看到很多似曾相識(shí)的東西。

Lynx 的出現(xiàn)時(shí)期,恰好是第一個(gè)爬蟲程序誕生的時(shí)候。有相當(dāng)大的理由相信他們的是一樣的理念。而且現(xiàn)在維護(hù)和更新Lynx的人員,有些也在維護(hù)其他開源的爬蟲程序。你其實(shí)也可以把Lynx看成一個(gè)可視化的爬蟲。

HTTrack 是一個(gè)比較宏觀的爬蟲模擬器。而Lynx就更細(xì)節(jié)一些,也更實(shí)用一點(diǎn)。


附錄 Lynx的簡(jiǎn)要使用說明:

以下為引用的內(nèi)容:

移動(dòng)命令:
下方向鍵:頁面上的下一個(gè)鏈接(用高亮度顯示)。
上方向鍵:頁面上的前一個(gè)鏈接(用高亮度顯示)。
回車和右方向鍵:
跳轉(zhuǎn)到鏈接指向的地址。
左方向鍵:回到上一個(gè)頁面。

滾動(dòng)命令:
+,Page-Down,Space,Ctrl+f:
向下翻頁。
-,Page-Up,b,Ctrl+b:
向上翻頁。
Ctrl+a: 移動(dòng)到當(dāng)前頁的最前面。
Ctrl+e: 移動(dòng)到當(dāng)前頁的最后面。
Ctrl+n: 向下翻兩行。
Ctrl+p: 往回翻兩行。
): 向下翻半頁。
(: 往回翻半頁。
#: 回到當(dāng)前頁的 Toolbar 或 Banner。

文件操作命令:

c: 建立一個(gè)新文件。
d: 下載選中的文件。
E: 編輯選中的文件。
f: 為當(dāng)前文件顯示一個(gè)選項(xiàng)菜單。
m: 修改選中文件的名字或位置。
r: 刪除選中的文件。
t: Tag highlighted file。
u: 上載一個(gè)文件到當(dāng)前目錄。

其他命令:

?,h: 幫助。
a: 把當(dāng)前鏈接加入到一個(gè)書簽文件里。
c: 向頁面的擁有者發(fā)送意見或建議。
d: 下載當(dāng)前鏈接。
e: 編輯當(dāng)前文件。
g: 跳轉(zhuǎn)到一個(gè)用戶指定的URL或文件。
G: 編輯當(dāng)前頁的URL,并跳轉(zhuǎn)到這個(gè)URL。
i: 顯示文檔索引。
j: 執(zhí)行預(yù)先定義的“短”命令。
k: 顯示鍵盤命令列表。
l: 列出當(dāng)前頁上所有鏈接的地址。
m: 回到首頁。
o: 設(shè)置選項(xiàng)。
p: 把當(dāng)前頁輸出到文件,e-mail,打印機(jī)或其他地方。
q: 退出。
/: 在當(dāng)前頁內(nèi)查找字符串。
s: 在外部搜索輸入的字符串。
n: 搜索下一個(gè)。
v: 查看一個(gè)書簽文件。
V: 跳轉(zhuǎn)到訪問過的地址。
x: 不使用緩存。
z: 停止當(dāng)前傳輸。
[backspace]:
跳轉(zhuǎn)到歷史頁(同 V 命令)。
=: 顯示當(dāng)前頁的信息。
: 查看當(dāng)前頁的源代碼。
!: 回到shell提示符下。
_: 清除當(dāng)前任務(wù)的所有授權(quán)信息。
*: 圖形鏈接模式的切換開關(guān)。
@: 8位傳輸模式或CJK模式的切換開關(guān)。
[: pseudo_inlines 模式的切換開關(guān)。
]: 為當(dāng)前頁或當(dāng)前鏈接發(fā)送一個(gè)“HEAD”請(qǐng)求。
Ctrl+r: 重新裝如當(dāng)前頁并且刷新屏幕。
Ctrl+w: 刷新屏幕。
Ctrl+u: 刪除輸入的行。
Ctrl+g: 取消輸入或者傳送。
Ctrl+t: 跟蹤模式的切換開關(guān)。
;: 看 Lynx 對(duì)當(dāng)前任務(wù)的跟蹤記錄。
Ctrl+k: 調(diào)用 Cookie Jar 頁。
數(shù)字鍵: 到后面的第 n 個(gè)鏈接。

作者:國(guó)平

來源:http://www.semyj.com/archives/426

標(biāo)簽: SEO 瀏覽器 搜索優(yōu)化 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請(qǐng)聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點(diǎn)!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請(qǐng)與原作者聯(lián)系。

上一篇:我是怎么看待網(wǎng)站中的友情鏈接的

下一篇:四個(gè)月把排名做到百度第一頁