一、什么是Sitemap Sitemap(即站點地圖)就是您網(wǎng)站上各網(wǎng)頁的列表。創(chuàng)建并提交Sitemap有助于百度發(fā)現(xiàn)并了解您網(wǎng)站上的所有網(wǎng)頁。您還可以使用Sitemap提供有關(guān)您網(wǎng)站的其他信息,如上次更新日期、Sitemap文件的更新頻率等,供百度Spider參考。
百度對已提交的數(shù)據(jù),不保證一定會抓取及索引所有網(wǎng)址。但是,我們會使用Sitemap中的數(shù)據(jù)來了解網(wǎng)站的結(jié)構(gòu)等信息,這樣可以幫助我們改進抓取策略,并在日后能更好地對網(wǎng)站進行抓取。
此外,Sitemap 與搜索排名沒有關(guān)系。
二、百度Sitemap支持哪些格式 百度Sitemap協(xié)議支持文本格式和xml格式,可以根據(jù)自己情況來選擇任意一種格式組織sitemap。具體格式說明及示例如下:
1.第一種格式樣例:txt文本格式 在一個txt文本列明需要向百度提交的鏈接地址,將txt文本文件通過搜索資源平臺進行提交 http://www.example.com/repaste/101562698_5230191316.html http://www.example.com/repaste/101586283_5230215075.html http://www.example.com/repaste/101639435_5230310576.html
此文本文件需要遵循以下指南: · 文本文件每行都必須有一個網(wǎng)址。網(wǎng)址中不能有換行。 · 不應(yīng)包含網(wǎng)址列表以外的任何信息。 · 您必須書寫完整的網(wǎng)址,包括 http。 · 每個文本文件最多可包含 50,000 個網(wǎng)址,并且應(yīng)小于10MB(10,485,760字節(jié))。如果網(wǎng)站所包含的網(wǎng)址超過 50,000 個,則可將列表分割成多個文本文件,然后分別添加每個文件。 · 文本文件需使用 UTF-8 編碼或GBK編碼。
2.第二種格式樣例:xml格式 單個xml數(shù)據(jù)格式如下: <?xml version="1.0" encoding="utf-8"?> <!-- XML文件需以utf-8編碼--> <urlset> <!--必填標簽--> <url> <!--必填標簽,這是具體某一個鏈接的定義入口,每一條數(shù)據(jù)都要用<url>和</url>包含在里面,這是必須的 --> <loc>http://www.yoursite.com/yoursite.html</loc> <!--必填,URL鏈接地址,長度不得超過256字節(jié)--> <lastmod>2009-12-14</lastmod> <!--可以不提交該標簽,用來指定該鏈接的最后更新時間--> <changefreq>daily</changefreq> <!--可以不提交該標簽,用這個標簽告訴此鏈接可能會出現(xiàn)的更新頻率 --> <priority>0.8</priority> <!--可以不提交該標簽,用來指定此鏈接相對于其他鏈接的優(yōu)先權(quán)比值,此值定于0.0-1.0之間--> </url> <url> <loc>http://www.yoursite.com/yoursite2.html</loc> <lastmod>2010-05-01</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset> 上述Sitemap向百度提交了一個url:http://www.yoursite.com/yoursite.html
若有多條url,按照上述格式重復(fù)<url></url>之間的片斷,列明所有url地址,打包到一個xml文件,向搜索資源平臺進行提交。
? Copyright 2023 深圳藍曬科技有限公司. 粵ICP備2023054553號-1