中文字幕在线观看,亚洲а∨天堂久久精品9966,亚洲成a人片在线观看你懂的,亚洲av成人片无码网站,亚洲国产精品无码久久久五月天

長尾關(guān)鍵詞的批量自動獲取思路及實現(xiàn)

2019-03-21    來源:seozzj.com

容器云強勢上線!快速搭建集群,上萬Linux鏡像隨意使用

以百度為例,思路如下:

1、搜索主關(guān)鍵詞,分析相關(guān)搜索鏈接,存入網(wǎng)址庫,標(biāo)記為未抓取。

2、讀取數(shù)據(jù)庫中標(biāo)記為未抓取的網(wǎng)址,抓取后分析相關(guān)搜索,存入網(wǎng)址庫,標(biāo)記為未抓取。

3、重復(fù)2直到指定深度(一般熱門關(guān)鍵詞6層左右深度差不多全部讀取,一般關(guān)鍵詞4層即可,理論上可以無限層,但需要抓取的數(shù)據(jù)量呈級數(shù)增長,相關(guān)性也越來越差,沒必要)。

4、人工處理長尾詞,這里需要人工去除一些無關(guān)的關(guān)鍵詞,保留合適的(當(dāng)前搜素引擎的語義處理能力還很弱)。

至此,基本完成了對長尾關(guān)鍵詞的處理,可以獲得一個比較全的長尾關(guān)鍵詞列表了。由于個人還需要研究不同層次關(guān)鍵詞之間的關(guān)系,所以存儲了搜索結(jié)果的網(wǎng)頁,定義了父子關(guān)系,也沒有過濾不同層之間相同的關(guān)鍵詞,這些對找長尾詞用處不大。

自動獲取文件指定目標(biāo)關(guān)鍵詞的php實現(xiàn)見附件:spider_keywords

這是我自用程序,提供一個實現(xiàn)方式,打算用的話還需要根據(jù)自己使用環(huán)境修改,要求懂php,SQL。關(guān)鍵部分如相關(guān)關(guān)鍵詞分析提取已經(jīng)做的比較穩(wěn)定,請放心使用。其中:

mykeyword.dat為存放關(guān)鍵詞的文件,每行一個主關(guān)鍵詞。

$depth為抓取深度,默認5層,對于一般關(guān)鍵詞夠深。

程序挖掘數(shù)據(jù)后存放在我的PostgreSQL數(shù)據(jù)庫,數(shù)據(jù)庫默認UTF-8編碼,可以根據(jù)自己的實際需要修改。數(shù)據(jù)表結(jié)構(gòu)如下:

– Table: mykeywords

– DROP TABLE mykeywords;

CREATE TABLE mykeywords

(id serial NOT NULL,

father text,

"content" text,

sons text,

depth text,

keyname text,

remark text,

is_spidered boolean,

CONSTRAINT mykeywords_pkey PRIMARY KEY (id)

)

WITH (OIDS=FALSE);

ALTER TABLE mykeywords OWNER TO postgres;

本文由seo蜘蛛站長所寫,出處:http://www.seozzj.com/seo-tips/long-tail-keywords-bulk/ 轉(zhuǎn)載請注明!

標(biāo)簽: seo 長尾關(guān)鍵詞挖掘 關(guān)鍵詞選擇 

版權(quán)申明:本站文章部分自網(wǎng)絡(luò),如有侵權(quán),請聯(lián)系:west999com@outlook.com
特別注意:本站所有轉(zhuǎn)載文章言論不代表本站觀點!
本站所提供的圖片等素材,版權(quán)歸原作者所有,如需使用,請與原作者聯(lián)系。

上一篇:robots.txt 原來還可以這樣寫

下一篇:2012年8月份 PR毫無章法的一次更新