怎么讓搜索引擎精準的抓取
今天就和大家說說,我們怎么做,讓搜索引擎精準的抓取我們站點!
一、head標簽中的部分
1.URL設計
URL盡量含有通用已成趨勢的移動命名,例如“m./wap./3g./mobi./mobile./mob/wml/”,可以在子域名等方面體現(xiàn)
2.頁面頂部的doctype標簽
作為協(xié)議的重要部分,doctype中是否移動化也很重要,檢查是否存在與移動相關的聲明,如這些關鍵詞,openmobilealliance, xhtml-mobile, xhtml-basic,wapforum,dtd compact html
例:“”
3.meta標簽中的viewport屬性和x-ua-compatible 屬性
viewport,移動前端開發(fā)中最重要的標簽,響應式設計的根基,如果你的頁面是遵守響應式設計的,那么說明這些頁面對移動設備有友好的輸出。
典型的的viewport代碼是這樣的,,判斷移動與否的關鍵屬性值為width,如果width=device-width這是典型的移動友好的設計,增加判定為移動頁面的砝碼,如果width有具體值,且值大于典型的移動屏幕(應該小于600),那么該頁面被判定為PC頁面的幾率大大增加。
但,META中還有一個很獨特的屬性作為SEO人員應該很少接觸到,那就是x-ua-compatible 屬性,該屬性是PC意味非常強烈的功能性代碼。示例代碼如此,,從百度工程師處得知,該代碼會有較強暗示當前頁面為PC頁面的功能,需選擇性使用。
4.title中的移動暗示
制作移動頁面時,在title標簽中寫明:“移動版”、“手機版”、“WAP版”、“觸屏版”不僅是照顧用戶體驗的方案,也利于頁面的移動識別,反之PC頁面要謹慎使用這些文案。
5.鏈接link標簽的media和href屬性中需要注意的細節(jié)(多為樣式文件)
media屬性值為screen時,表示屏幕中的顯示樣式,link的href所填寫的URL(基本為樣式文件的URL)就比較重要了,一定程度加大不同設備的偏重。此時URL中盡量出現(xiàn)/wap,/mobile/這樣的命名,同URL設計一樣,用于提高頁面識別為移動的效率和概率。如URL中含有pc字樣則加大識別為PC頁面的幾率。
6.一些通用的PC類識別HTML代碼
embed:經(jīng)常用于嵌入多媒體
object:用于嵌入對象
marquee:老舊的滾動特效實現(xiàn)代碼
iframe:想必網(wǎng)站優(yōu)化人員很熟悉了,典型的PC常用標簽
這些典型的用于PC或者老舊的、HTML5已經(jīng)有更高效替代方案的舊標簽,意味著使用它們將增加頁面的PC屬性,需要有目的地取舍。
7.一些javascript中典型的PC特征
加載swfobject、含有activexobject語句:移動頁面根本不會使用如此重的多媒體引用方案(可以問你的前端工程師)
含有netscape(網(wǎng)景)、msie(IE)、firefox(火狐)、browser.msie(IE)這些典型的非移動端瀏覽器兼容代碼的
設置了timer的 ,以及JS代碼含有settimeout的(此處不知道為什么設置timer還有識別的問題),均大幅增加識別為PC頁面的可能性
以上這些中出現(xiàn)的內容
二、正文body中需要注意的部分
鏈接和文本遵照的原則基本與head中一樣——多出現(xiàn)移動相關的字眼;頁面設置的寬度不要超過常規(guī)移動設備的大小;那些常識中(除非招錯前端工程師)絕對只用于PC的一些兼容性代碼。
此外div塊的個數(shù)也值得注意,沒有哪家移動頁面會過量使用div塊;還有典型的只用于適配PC機器的HTML代碼,例如:accesskey(如果移動頁面用,要不前端招錯人了,要不產(chǎn)品招錯人了,應該引起警覺)
head和正文兩大部分,基本涵蓋了一張頁面最主要的部分。
網(wǎng)站優(yōu)化人員一定要把握這些使用細節(jié),協(xié)助前端工程師從正反方向將公司的PC和手機頁面涇渭分明地呈現(xiàn)給搜索引擎。試想如果你每日被抓取頁面達到90%的識別率,而一般水平是70%,這種優(yōu)化增量是非常顯著的。
最后,分享一個機器學習的思想給網(wǎng)站優(yōu)化的新人,此文中心思想截取如下:“你從市場上的芒果里隨機的抽取一定的樣品(訓練數(shù)據(jù)), 制作一張表格, 上面記著每個芒果的物理屬性, 比如顏色, 大小, 形狀, 產(chǎn)地, 賣家, 等等。(這些稱之為特征)。 還記錄下這個芒果甜不甜, 是否多汁,是否成熟(輸出變量)。你將這些數(shù)據(jù)提供給一個機器學習算法(分類算法/回歸算法),然后它就會學習出一個關于芒果的物理屬性和它的質量之間關系的模型。 下次你再去市集, 只要測測那些芒果的特性(測試數(shù)據(jù)),然后將它輸入一個機器學習算法。算法將根據(jù)之前計算出的模型來預測芒果是甜的,熟的, 并且/還是多汁的。
?
一、head標簽中的部分
1.URL設計
URL盡量含有通用已成趨勢的移動命名,例如“m./wap./3g./mobi./mobile./mob/wml/”,可以在子域名等方面體現(xiàn)
2.頁面頂部的doctype標簽
作為協(xié)議的重要部分,doctype中是否移動化也很重要,檢查是否存在與移動相關的聲明,如這些關鍵詞,openmobilealliance, xhtml-mobile, xhtml-basic,wapforum,dtd compact html
例:“”
3.meta標簽中的viewport屬性和x-ua-compatible 屬性
viewport,移動前端開發(fā)中最重要的標簽,響應式設計的根基,如果你的頁面是遵守響應式設計的,那么說明這些頁面對移動設備有友好的輸出。
典型的的viewport代碼是這樣的,,判斷移動與否的關鍵屬性值為width,如果width=device-width這是典型的移動友好的設計,增加判定為移動頁面的砝碼,如果width有具體值,且值大于典型的移動屏幕(應該小于600),那么該頁面被判定為PC頁面的幾率大大增加。
但,META中還有一個很獨特的屬性作為SEO人員應該很少接觸到,那就是x-ua-compatible 屬性,該屬性是PC意味非常強烈的功能性代碼。示例代碼如此,,從百度工程師處得知,該代碼會有較強暗示當前頁面為PC頁面的功能,需選擇性使用。
4.title中的移動暗示
制作移動頁面時,在title標簽中寫明:“移動版”、“手機版”、“WAP版”、“觸屏版”不僅是照顧用戶體驗的方案,也利于頁面的移動識別,反之PC頁面要謹慎使用這些文案。
5.鏈接link標簽的media和href屬性中需要注意的細節(jié)(多為樣式文件)
media屬性值為screen時,表示屏幕中的顯示樣式,link的href所填寫的URL(基本為樣式文件的URL)就比較重要了,一定程度加大不同設備的偏重。此時URL中盡量出現(xiàn)/wap,/mobile/這樣的命名,同URL設計一樣,用于提高頁面識別為移動的效率和概率。如URL中含有pc字樣則加大識別為PC頁面的幾率。
6.一些通用的PC類識別HTML代碼
embed:經(jīng)常用于嵌入多媒體
object:用于嵌入對象
marquee:老舊的滾動特效實現(xiàn)代碼
iframe:想必網(wǎng)站優(yōu)化人員很熟悉了,典型的PC常用標簽
這些典型的用于PC或者老舊的、HTML5已經(jīng)有更高效替代方案的舊標簽,意味著使用它們將增加頁面的PC屬性,需要有目的地取舍。
7.一些javascript中典型的PC特征
加載swfobject、含有activexobject語句:移動頁面根本不會使用如此重的多媒體引用方案(可以問你的前端工程師)
含有netscape(網(wǎng)景)、msie(IE)、firefox(火狐)、browser.msie(IE)這些典型的非移動端瀏覽器兼容代碼的
設置了timer的 ,以及JS代碼含有settimeout的(此處不知道為什么設置timer還有識別的問題),均大幅增加識別為PC頁面的可能性
以上這些中出現(xiàn)的內容
二、正文body中需要注意的部分
鏈接和文本遵照的原則基本與head中一樣——多出現(xiàn)移動相關的字眼;頁面設置的寬度不要超過常規(guī)移動設備的大小;那些常識中(除非招錯前端工程師)絕對只用于PC的一些兼容性代碼。
此外div塊的個數(shù)也值得注意,沒有哪家移動頁面會過量使用div塊;還有典型的只用于適配PC機器的HTML代碼,例如:accesskey(如果移動頁面用,要不前端招錯人了,要不產(chǎn)品招錯人了,應該引起警覺)
head和正文兩大部分,基本涵蓋了一張頁面最主要的部分。
網(wǎng)站優(yōu)化人員一定要把握這些使用細節(jié),協(xié)助前端工程師從正反方向將公司的PC和手機頁面涇渭分明地呈現(xiàn)給搜索引擎。試想如果你每日被抓取頁面達到90%的識別率,而一般水平是70%,這種優(yōu)化增量是非常顯著的。
最后,分享一個機器學習的思想給網(wǎng)站優(yōu)化的新人,此文中心思想截取如下:“你從市場上的芒果里隨機的抽取一定的樣品(訓練數(shù)據(jù)), 制作一張表格, 上面記著每個芒果的物理屬性, 比如顏色, 大小, 形狀, 產(chǎn)地, 賣家, 等等。(這些稱之為特征)。 還記錄下這個芒果甜不甜, 是否多汁,是否成熟(輸出變量)。你將這些數(shù)據(jù)提供給一個機器學習算法(分類算法/回歸算法),然后它就會學習出一個關于芒果的物理屬性和它的質量之間關系的模型。 下次你再去市集, 只要測測那些芒果的特性(測試數(shù)據(jù)),然后將它輸入一個機器學習算法。算法將根據(jù)之前計算出的模型來預測芒果是甜的,熟的, 并且/還是多汁的。
?
1 個評論
讓搜索引擎搜索結果更精準的方法:
1、完整搜索”關鍵詞“表示查詢詞不能被拆分,在搜索結果中必須完整出現(xiàn)。
2、不含某個詞,表示所有搜索結果不包含減號后面的詞,含有它的網(wǎng)頁將被過濾掉。
3、標題中搜索intitle,表示搜索結果的標題都必須含有intitle:后的查詢詞,幫助排除無關網(wǎng)頁。
4、指定網(wǎng)站site:表示搜索結果一定來自你輸入的網(wǎng)站。
5、并行搜索|,表示搜索結果中包含詞語A和B中的任意一個,不必同時包含這兩個詞。
6、ERL中搜索inurl,表示搜索結果中,查詢詞需要出現(xiàn)在網(wǎng)頁的URL里。
7、搜索政府網(wǎng)頁inurl:gov,表示搜索出來的網(wǎng)頁都是URL中帶有gov的政府網(wǎng)站。
8、指定格式filetype,表示搜索特定的文件格式
想了解更多獨立站信息可以加劉小喵QQ 982709520 現(xiàn)在加好友還可以免費獲得十五天試用哦
1、完整搜索”關鍵詞“表示查詢詞不能被拆分,在搜索結果中必須完整出現(xiàn)。
2、不含某個詞,表示所有搜索結果不包含減號后面的詞,含有它的網(wǎng)頁將被過濾掉。
3、標題中搜索intitle,表示搜索結果的標題都必須含有intitle:后的查詢詞,幫助排除無關網(wǎng)頁。
4、指定網(wǎng)站site:表示搜索結果一定來自你輸入的網(wǎng)站。
5、并行搜索|,表示搜索結果中包含詞語A和B中的任意一個,不必同時包含這兩個詞。
6、ERL中搜索inurl,表示搜索結果中,查詢詞需要出現(xiàn)在網(wǎng)頁的URL里。
7、搜索政府網(wǎng)頁inurl:gov,表示搜索出來的網(wǎng)頁都是URL中帶有gov的政府網(wǎng)站。
8、指定格式filetype,表示搜索特定的文件格式
想了解更多獨立站信息可以加劉小喵QQ 982709520 現(xiàn)在加好友還可以免費獲得十五天試用哦
精選服務
¥