為了解決新網站不被收錄的問題,我們必須首先知道影響網站不被收錄的因素是什么,從而找到不被收錄問題的具體影響,并解決它!
影響因素的爬蟲爬行:
首先查看爬蟲每天訪問您網站的次數,然后查看一周內是否可以包含爬蟲頁面。如果爬網頁面不被收錄,抓取也沒問題,問題就在網頁本身上。如果爬蟲沒有抓取,那一定是抓取的問題。此時,添加一些場外鏈接以吸引爬蟲訪問自己的網站,或提交百度的自動推送、主動推送、網站地圖、移動終端日級收藏等,通知爬蟲您的URL。
當然,提交到搜索引擎URL并不意味著它也會被爬網。搜索引擎有一個爬網隊列,首先要捕獲哪些網頁,然后要捕獲哪些網頁,您的URL排序是高還是低也會影響它是否會被爬網 (為了解決這個問題,您需要為內部鏈做一些工作,比如每個網址鏈接到網站其他頁面的次數,次數越多,頁面就越重要,自然爬網的隊列順序越高。)。
影響因素的問題:
同樣抓住了,也就是說,不被收錄,無疑是網頁本身的問題,網頁的問題必須分開:
網頁打開速度很慢嗎?
網絡內容的質量通過了嗎?
網頁爬蟲的整體內容是否可識別?
從頁面速度來看,您可以優化服務器的配置和帶寬,程序上代碼執行的效率也會影響打開速度。建議如果速度為1秒,則需要優化到幾百毫秒。如果必須給出一個值,我的建議是500毫秒 (這是頁面打開速度,而不是服務器鏈接速度)。
就內容質量而言,我將在這里給出幾點:
對于新網站,應在85% 處保證內容的原創性;
內容的可讀性必須很強,說話流暢,不能冗長;
標題是什么,寫下內容是什么。你不能這樣賣狗肉;
對于字數沒有明確的要求,但是為了更好地幫助你建議大約600 ~ 800,這只是一個參考值;
爬蟲內容是否可識別取決于您是否使用了js來加載內容,沒有alt的圖片太多,或者alt聲明不合理,以及falsh的使用等,這可以通過百度搜索資源的網站管理員工具進行爬網。診斷,查看爬蟲是否獲取所有內容。
最后,鏈接的重要性
一開始提到,一個網頁鏈接的次數越多,搜索引擎就越認為它很重要,并且一定的百分比會增加被包含的可能性。這里我們必須從兩點開始。
1.當前網頁的鏈接數量。
你希望這個網頁包含多少次,鏈接到這個網頁的頁面已經包含了嗎?排名?如果它沒有被包括在內或排名,你如何看待搜索引擎知道這個頁面的鏈接是給你的?
2.鏈接到您的網頁的重要性
其他人的主頁給你一個鏈接,其他人的內頁給你一個鏈接。重要性完全不同。但是不可能有這么多重要的網頁給你一個內部頁面的鏈接。因此,我們此時需要做的是通過交換友好鏈接來增強我們主頁和其他網頁的重要性,從而合理地部署內部鏈結構,從而增加重要鏈接的數量。
重要而多的鏈接指向你,內容沒有問題,爬蟲也抓住了,速度也很快,爬蟲也可以識別你的內容。如果你不包括它,你需要通過百度搜索資源平臺從網站管理員那里反饋情況。因為有時各種搜索引擎中會出現錯誤,這是我個人經歷過的事情。
如上所述,我對超過一個月不被收錄在新網站中的問題的回答。希望對您有所幫助!