เมื่อเว็บมีการพัฒนา Google และ SEO ก็เช่นกัน ผู้เชี่ยวชาญแต่ละท่าน ต่างก็แนะนำว่าให้ทำแบบนั้น ทำแบบนี้ แถมยังบอกอีกว่านี้เป็นวิธีที่ดีที่สุดแล้ว จริงอยู่ว่าสิ่งที่บอกนั้นมันดี แต่มันอาจจะดีสำหรับเมื่อวาน พอถึงวันนี้มันอาจไม่ดีอย่างที่ควรจะเป็นแล้วก็ได้
ปัญหาก็คือ เมื่อหลายๆ คนโพสต์วิธีการ คำแนะนำ หรือคำตอบลงในกระทู้ หรือ Social Media สิ่งที่ผู้อ่านหรือผู้ชมควรทำคือพิจารณาและแยกแยะให้ดีว่าข้อมูลต่างๆ ที่โพสต์ลงไปนั้นอันไหนสามารถทำได้จริง หรือใช้ไม่ได้เลย
ซึ่งโดยปกติแล้ว ส่วนใหญ่จะรู้ดีอยู่แล้วว่า ต้องเพิ่ม Sitemap ลงใน Google Search Console แต่ไม่รู้ว่า Sitemap จะช่วยในเรื่องของการทำ SEO (KPIs) ได้อย่างไร
ดังนั้น ในบทความนี้จะบอกถึงวิธีการสร้างและการปรับปรุง XML Sitemap ที่จำเป็น พร้อมทั้งวิธีการตรวจสอบ โดยมีรายละเอียดเนื้อหา ดังนี้
- XML Sitemap คืออะไร?
- รูปแบบของ XML Sitemap
- ชนิดของ Sitemaps
- การเพิ่มประสิทธิภาพในการจัดทำดัชนีของ XML Sitemap
- วิธีการตรวจสอบ XML Sitemap ที่ดีที่สุด
XML Sitemap คืออะไร?
XML Sitemap คือแผนผังของเว็บไซต์ ซึ่งจะเป็นเหมือนสารบัญ บอก Seach Engine ให้รู้ว่าว่า มีเนื้อหาใดบ้าง และเข้าถึงได้อย่างไร
จากภาพด้านบน จะเห็นได้ว่าเว็บไซต์นี้มีหน้าเว็บเพจอยู่ 9 หน้่า ซึ่งหากเป็น XML Sitemap จะเข้าดูทีเดียวเลยทั้ง 9 หน้า แต่หากเป็นเว็บไซต์จะต้องเข้าทีละหน้า โดยจะเข้าผ่านลิงก์ทีละหน้าๆ ไปเรื่อยๆ จนถึงหน้าสุดท้าย
ซึ่งจากตรงนี้จะเห็นได้ว่า XML Sitemap จะทำการรวบรวมและจัดทำดัชนีของเว็บได้อย่างรวดเร็ว ดังนั้น XML Sitemap จึงเหมาะกับ
- เว็บไซต์ที่มีหน้าเพจหลายร้อยหลายพันหน้า หรือเว็บไซต์ที่มีโครงสร้างซับซ้อน
- เว็บไซต์ที่มีการเพิ่มหน้าเพจบ่อยๆ
- เว็บไซต์ที่มีการเปลี่ยนเนื้อหาเพจอยู่บ่อยๆ
- เว็บไซต์ที่มีการเชื่อมโยงภายในเว็บไม่ดีและไม่มีลิงก์เชื่อมกันภายในเว็บไซต์
- ไม่มีลิงก์เชื่อมต่อกับเว็บภายนอก
Note: Sitemap ที่ไม่มีการทำดัชนีของ URL ยังสามารถเพิ่มความเร็วในการจัดดัชนีได้อีกด้วย ซึ่งวิธีการนี้อาจจะดีกว่าลบ URL ใน Google Search Console ในกรณีที่มีหน้าเว็บไซต์ที่ต้องทำดัชนีเยอะ ดังนั้นคุณจะต้องตรวจสอบให้ดีนะว่าได้เพิ่ม URL ลงใน Sitemap แล้ว
ข้อควรจำ
ถึงแม้ว่า Search Engine จะสามารถค้นหา URL เว็บไซต์ของคุณได้โดยไม่ต้องใช้ XML Sitemap แต่หากมีการใช้ XML Sitemap เมื่อไหร่ มันจะเป็นการบอกให้รู้ว่าเว็บไซต์ของคุณมีคุณภาพ
แม้ว่าจะไม่มีการรับประกันว่าเว็บไซต์ที่มีการทำ XML Sitemap จะทำให้เว็บไซต์ของคุณแสดงผลในการค้นหาหรือถูกจัดอันดับในการค้นหาในอันดับต้นๆ หรือไม่ แต่สิ่งหนึ่งที่รู้ก็คือ การทำ XML Sitemap จะช่วยเพิ่มโอกาสของเว็บไซต์ในการแสดงผลอย่างแน่นอน
รูปแบบของ XML Sitemap
เว็บไซต์ที่มีหน้าเพจเดียว จะมีแผนผัง XML Sitemap ดังนี้
SEO จะใช้ tag เหล่านี้อย่างไร? มาดูกันว่าค่า metadata ทั้งหมดที่อยู่ในกล่องสี่เหลี่ยมสีแดงคืออะไร
Tag Loc หรือก็คือ Location
tag นี้จะเป็นการบอกตำแหน่ง URL ของเว็บไซต์ ซึ่งจะต้องใส่ชื่อเว็บไซต์เต็มๆ คือต้องมี http หรือ https ด้วย ส่วน www จะใส่หรือไม่ใส่ก็ได้
ส่วนเว็บไซต์แบบ international จะต้องใช้ hreflang มาใช้ในการประมวลผลร่วมด้วย ซึ่งการใช้ xhtm: link จะระบุตัวภาษาและประเทศของแต่ละ URL โดยจะช่วยลดเวลาในการโหลดหน้าเว็บ โดยส่วนใหญ่จะทำการประมวลในส่วน <head> หรือ ไม่ได้ใส่เพิ่มลงในส่วนของ HTTP
หากต้องการศึกษาเกี่ยวกับ hreflang สามารถดูรายละเอียดในส่วนนี้ได้ที่ hreflang: The ultimate guide
Tag lastmod หรือก็คือ Last Modified
เป็น tag ที่ใช้เพื่อบอกวันที่และเวลาแก้ไขหน้าเพจล่าสุด ซึ่งจริงๆ จะไม่ใช้ก็ได้นะ แต่เพื่อช่วยในเรื่อง SEO แนะนำให้ใช้ tag นี้ดีกว่าเพื่อให้ Google ได้รู้ว่าคุณเป็นเจ้าของหรือผู้เผยแพร่เนื้อหานี้คนแรก
นอกจากนี้ยังเพิ่มประสิทธิภาพของหน้าเพจในการอัปเดตข้อมูลใหม่ แต่ต้องมั่นใจนะว่าการเปลี่ยนแปลงวันที่อัปเดตนั้นมีการแก้ไขข้อมูลหน้าเพจจริงๆ เพราะหากเป็นการอัปเดตวันที่เพื่อหลอก search engine อาจได้รับการลงโทษ Google ได้
Tag changefreq หรือก็คือ Change Frequency
เมื่อก่อนนี้ tag นี้เป็นเพียงแค่คำแนะนำความถี่ในการเปลี่ยนแปลงเนื้อหาในหน้าเว็บไซต์ ซึ่งมีผลกับ Search Engine แต่ความถี่ในการเปลี่ยนแปลงนั้นไม่มีผลกับ Sitemap ซึ่งการระบุเวลาโดยตรงนั้นจะดีกว่า
Tag priority
คุณสามารถกำหนดความสำคัญของหน้าเว็บไซต์ได้ โดยค่าจะอยู่ที่ 0.0-1.0 (1 คือสูงสุด 0 คือต่ำสุด) ซึ่งจริงๆ แล้ว สามารถเพิกเฉยต่อค่านี้ได้นะคะ
ข้อควรจำ
แน่นอนว่าเว็บไซต์ต้องการ XML Sitemap แต่ในเรื่องของการตั้งค่า tag ต่างๆ จริงๆ แล้วไม่จำเป็นต้องเปลี่ยนแปลงข้อมูลใน tag priority และ frequency
การใช้ tag – lastmod เพื่อให้ผลลัพธ์ที่ถูกต้องและแม่นยำ จะต้องเช็คให้เช็คให้ดีว่า URL ที่ส่งไปนั้นถูกต้อง
ชนิดของ Sitemaps
Sitemaps มีหลายประเภท เรามาดูกันว่ามีอะไรบ้าง
XML Sitemap Index
XML Sitemaps มีข้อจำกัดอยู่ไม่กี่ข้อ ดังนี้
- จำกัด URL ได้ไม่เกิน 50,000 URLs
- จำกัดขนาดไฟล์ไม่เกิน 50 MB
Sitemap สามารถบีบอัดได้โดยใช้ gzip (ชื่อไฟล์จะเป็น sitemap.xml.gz) เพื่อประหยัดการใช้ bandwidth ของ server แต่เมื่อแตกไฟล์ออกมาแล้ว ไฟล์นั้นก็จะต้องไม่เกินขนาดที่ทาง sitemap กำหนดไว้
แต่หากไฟล์นั้นมีขนาดเกินที่ sitemap กำหนด วิธีแก้คือต้องแบ่ง URLs ออกเป็น XML Sitemap หลายๆ Sitemaps
ซึ่ง Sitemaps หลายๆ อันสามารถรวมกันเป็น XML Sitemap เป็นไฟล์ index อันเดียวได้ โดยจะใช้ชื่อว่า sitemap-index.xml ในกรณีที่เว็บไซต์มีขนาดใหญ่และต้องการใช้วิธีย่อยเว็บนั้นออกมา สามารถสร้างไฟล์ index หลายไฟล์ ยกตัวอย่างเช่น
- sitemap-index-articles.xml
- sitemap-index-products.xml
- sitemap-index-categories.xml
แต่อย่าสร้างไฟล์ index ซ้อนกันใน sitemap ได้
เพื่อให้ Search Engine สามารถค้นหาไฟล์ใน Sitemap ได้ทั้งหมดในครั้งเดียว ให้ทำตามขั้นตอนต่อไปนี้
- เพิ่ม index ของ Sitemap ใน Google Search Console และ Bing Webmaster Tools
- ระบุ index ของ Sitemap ลงในไฟล์ robots.txt ของเว็บไซต์ที่ต้องการ และแจ้งให้ Search Engine รู้ว่า เรายินดีให้ Search Engine เข้ามาทำการเก็บข้อมูลของเว็บไซต์
นอกจากนี้คุณสามารถส่ง Sitemap ด้วยการ ping ไปยัง Google
ข้อควรระวัง : Google ไม่สนใจหากมี hreflang ในเว็บไซต์ที่ไม่ได้รับการยืนยันหรือ Verified ซึ่งในกรณีอาจหมายถึงการส่ง URL ผ่าน ping
XML Image Sitemap
Sitemap ของรูปภาพจะถูกสร้างขึ้นมาเพื่อจัดทำดัชนีเนื้อหาของรุปภาพ อย่างไรก็ตาม การทำ SEO ในปัจจุบันนี้ รูปภาพจะถูกฝังอยู่ในเนื้อหาของหน้าเว็บไซต์ เบื้องต้นข้อมูลของรูปภาพจะถูกเก็บไปพร้อใกับ URL ของเว็บอยู่แล้ว
ยิ่งไปกว่านี้ หากมีการใช้งาน JSON-LD schema.org/ImageObject ในการเรียกคุณสมบัติของรูปภาพใน Search Engine เนื่องจากมี attributes มากกว่า Sitemap ของรูปภาพ
ดังนั้น XML Sitemap ของรูปภาพจึงไม่จำเป็นสำหรับเว็บไซต์ รวมไปถึงการทำ Sitemap ของรูปภาพก็สิ้นเปลืองงบประมาณอีกด้วย
เว้นเสียแต่ว่ารูปภาพนั้นมีประโยชน์ต่อการทำธุรกิจ อย่างเว็บไซต์ขายรูปภาพหรือ เว็บ e-commerce ที่สามารถเข้าถึงผ่านการค้นหารูปภาพ Google Image
โปรดจงรู้ไว้ว่า รูปภาพนั้นไม่จำเป็นจะต้องอยู่ภายใต้โดเมนเดียวกันกับเว็บไซต์ที่มีการทำ Sitemap ซึ่งสามารถใช้ CDN ได้ แต่มีข้แม้ว่าจะต้องมีการตรวจสอบหรือ Verify ใน Search Console แล้ว
XML Video Sitemap
XML Sitemap ของวิดีโอ จะเหมือนกับรูปภาพเลย แต่หากวิดีโอนั้นมีประโยชน์ต่อการทำธุรกิจ ก็ให้ใช้ XML Sitemap ของวิดีโอด้วย แต่หากเว็บไซต์ไม่มีวิดีโอหรือวิดีโอนั้นไม่มีประโยชน์ต่อเว็บไซต์ ก็ไม่ต้องมีก็ได้
เพื่อประหยัดงบประมาณในการเก็บรวบรวมข้อมูลบนหน้าเว็บไซต์ที่มีวิดีโอฝังอยู่แนะนำให้เพิ่มวิดีโอทั้งหมดด้วย JSON-LD เช่น schema.org/VideoObject
Google News Sitemap
เฉพาะเว็บไซต์ที่ลงทะเบียนกับ Google News เท่านั้น ถึงจะใช้ Sitemap นี้ได้
ถ้ามีการรวบรวมบทความที่เผยแพร่ไว้ในสองวันที่ผ่านมา การทำ Sitemap จะต้องมี URL ไม่เกิน 1,000 URLs ต่อ 1 เว็บไซต์ และต้องมีการเผยแพร่บทความนี้ทันที
ในทางกลับกัน บางอุปกรณ์ที่ใช้ในการ online Google Sitemap ของ News จะไม่รองรับ URL ของรูปภาพ ในการนี้ Google แนะนำให้ใช้ภาพ schema.org หรือ og:image เพื่อระบุภาพขนาด Thumbnail สำหรับ Google News
Mobile Sitemap
อันนี้ไม่จำเป็นเลยจริงๆ สำหรับเว็บไซต์ เพราะ mobile Sitemap มีไว้เฉพาะ feature หน้าเพจสำหรับโทรศัพท์เท่านั้น ไม่สามารถใช้ได้กับ smartphone
ดังนั้นหาดคุณมี URL ที่สร้างขึ้นมาโดยเฉพาะสำหรับใช้งานกับ Feature โทรศัพท์ Mobile Sitemap จึงไม่มีประโยชน์ที่ใช้
HTML Sitemap
HTML Sitemap เป็นสิ่งที่ Search Engine ต้องการ ซึ่ง HTML Sitemap ออกแบบมาเพื่อช่วยผู้ใช้ในการค้นหาบทความ คำถามก็คือ หากคุณเป็นผู้ใช้งานที่ดี มีประสบการณ์ในการออกแบบเว็บไซต์ และออกแบบลิงก์ภายนอกหรือ External Link มาอย่างดี ยังจะต้องการ HTML Sitemap อีกหรือไม่?
เราสามารถเช็คจำนวนผู้เข้าชมเว็บของ HTML Sitemap ใน Google Analytics ซึ่งมีโอกาสที่จะต่ำน้อยมาก แต่หากผลการเข้าชมต่ำ นั่นหมายถึงเวลาที่จะต้องปรับปรุงเว็บไซต์แล้วล่ะ
โดยทั่วไป HTML Sitemap จะมีลิงก์เชื่อมต่อกับส่วน Footer ของเว็บไซต์ ซึ่งจะใช้ link equity จากทุกๆ หน้าเพจของเว็บไซต์นั้นๆ
ลองลองถามตัวเองดูซิว่า การใช้ link equity นั้นเป็นวิธีที่ดีที่สุดหรือไม่? หรือใช้ HTML Sitemap เพราะเป็นกฎที่ใช้กันมาแต่เดิม?
ถ้ามีคนใช้ HTML Sitemap น้อย และ Search Engine ไม่ต้องการ HTML Sitemap เพีบงแค่เว็บไซต์ของคุณมีลิงก์ภายในหรือ internal Link ที่ดีกับ XML Sitemap แล้วคุณยังต้องการ HTML Sitemap อีกหรือไม่? สำหรับคำถามนี้ตอบได้เลยว่า “ไม่!!!”
Dynamic XML Sitemap
Static Sitemaps สามารถสร้างได้ง่ายๆ โดยใช้เครื่องมืออย่าง Screaming Frog แต่ปัญหาก็คือ เมื่อมีการสร้างหรือลบหน้าเพจ Sitemap ของเว็บนั้นจะกลายเป็นข้อมูลเก่าทันที แต่ถ้ามีการแก้ไขหน้าเพจ Sitemap จะไม่อัปเดต tag lastmod อัตโนมัติทันที
หากมีการสร้างและอัปโหลด Sitemap ทุกครั้งที่มีการเปลี่ยนแปลง วิธีที่ดีที่สุด ควรหลีกเลี่ยงการใช้งาน Static Sitemaps
แต่หากใช้ Dynamic XML Sitemap ระบบจะอัปเดตให้อัตโนมัติ โดย server จะแสดงการเปลี่ยนแปลงของหน้าเว็บตามการเปลี่ยนแปลงทันที
วิธีการสร้าง Dynamic XML Sitemap มีขั้นตอนการทำ ดังนี้
- หากนักพัฒนาเว็บเขียนโค้ดหรือสคริปต์ขึ้นมาเอง จะต้องระบุข้อกำหนดให้ชัดเจน
- ใช้เคร่ืองมือในการสร้าง Dynamic XML Sitemap
- ติดตั้งปลั๊กอินสำหรับ CMS สำหรับเว็บไซต์ ยกตัวอย่างเช่น ปลั๊กอิน Yoast SEO ของ WordPress
ข้อควรจำ
Dynamic XML Sitemap กับ การทำดัชนีของ Sitemap ถือว่าเป็นวิธีที่ดีที่สุด แต่มือถือกับ HTML Sitemap อาจจะไม่จำเป็นต้องทำ
หากต้องให้ทำดัชนีในส่วนของเนื้อหาที่เกี่ยวกับรูปภาพ, วิดีโอและ Google News ให้ดีขึ้น เพื่อเพิ่มค่า KPIs ให้ดีขึ้น ก็ควรจะต้องใช้ Sitemap สำหรับ รูปภาพ, วิดีโอและ Google News
การเพิ่มประสิทธิภาพในการจัดทำดัชนีของ XML Sitemap
มาถึงส่วนที่สนุกแล้ว ในส่วนนี้จะบอกถึงวิธีการใช้ XML Sitemap เพื่อเพิ่มประสิทธิภาพ KPIs ของ SEO
เฉพาะหน้าเพจ SEO ที่อยู่ใน XML Sitemaps
XML Sitemap จะแสดงหน้าเพจที่ต้องการให้ Search Engine มาเก็บรวบรวมข้อมูล ซึ่งไม่จำเป็นต้องเก็บทุกหน้าก็ได้
เมื่อแมงมุมไต่เข้ามายังเว็บไซต์เป้าหมายมันจะไต่เข้ามาเก็บข้อมูลเฉพาะหน้าเพจที่อนุญาตหรือตั้งค่า “allowance” เท่านั้น XML Sitemap จะระบุว่า URLที่ถูกเก็บรวบรวมมาใน Sitemap นั้นมีความสำคัญกว่า URL ที่ไม่ถูกบล็อก ซึ่งไม่อยู่ใน Sitemap ด้วย
เมื่อไหร่คุณใช้ XML Sitemap และหาก Search Engine พูดได้ คงจะพูดออกมาว่า “ขอบคุณมากๆ เลย ที่คุณสนใจและใส่ใจกับ URL ทั้งหมดนี้เป็นพิเศษ”
ดังนั้น เพื่อให้ SEO ของแต่ละหน้าเพจที่ทาง XML Sitemap เก็บรวบรวมมานั้น จะช่วยให้ Search Engine ทำการจัดลำดับเว็บไซต์ ทำให้ผลการค้นหาเว็บไซต์อยู่ในอันดับที่ดี แต่ก็ยังมีข้อยกเว้น การทำ XML Sitemap ดังนี้
- หน้าเพจที่เป็น Non-canonical pages
- หน้าเพจที่มีการ Copy จากหน้าอื่นมา
- หน้าเพจเป็น Paginated pages
- URL ที่มีการใช้ Parameter หรือ Session ID
- หน้าผลการค้นหาในเว็บไซต์
- URL ที่มีการตอบกลับ comments
- URL ที่มีการแชร์ผ่านอีเมล
- URL ที่มีการสร้างขึ้นโดยการกรอง ซึ่งไม่มีผลต่อการทำ SEO
- Archive pages
- หน้าที่มีการเปลี่ยนเส้นทาง (3XX), หน้าที่หายไป (4XX), และหน้า Server error (5xx)
- หน้าเพจที่ถูกบล็อกโดย robots.txt
- หน้าเพจที่ไม่มีการจัดทำ index
- หน้า Resource pages ที่เข้าถึงได้ด้วยแบบฟอร์ม อย่างเช่นเอกสาร PDF
- หน้า Utility pages ที่เป็นประโยชน์สำหรับผู้ใช้ แต่ไม่ได้ใช้เป็นหน้า landing pages ยกตัวอย่างเช่น หน้า Login, หน้าติดต่อเรา, หน้านโยบายความเป็นส่วนตัว, หน้าบัญชีผู้ใช้ เป็นต้น
ยกตัวอย่างเพื่อให้เก็นภาพ สมมติว่าเว็บไซต์ของคุณมีหน้าเพจ 1,000 หน้า ซึ่งมีหน้าเพจ 475 หน้า ซึ่งมีเนื้อหาที่ใช้ทำ SEO ด้วย โดยคุณนำหน้าเพจทั้ง 475 นั้นไปเพิ่มลงใน XML Sitemap และบอกให้ Google ลดความสำคัญของหน้าอื่นๆ ลงไป
ทีนี้เมื่อ Google เก็บรวบรวมข้อมูลทั้ง 475 หน้าเรียบร้อยแล้ว และมีการจัดอันดับหน้าเป็นดังนี้
มีหน้าเพจจำนวน 175 หน้า ที่ Google ให้เป็นระดับ “A”, 200 หน้าเพจ Google ให้เป็นระดับ “B+” กับ และ 100 หน้า Google ให้เป็น “B” กับ “B-” ซึ่งเกรดที่ Google ออกมานี้บอกให้ทราบถึงคุณภาพของเว็บไซต์ที่เหมาะสมต่อการใช้งานของผู้ใช้
ตรงกันข้ามหากนำหน้าเพจทั้งหมด 1,000 หน้าไปทำ XML Sitemap Google ก็จะตรวจสอบหน้าเว็บทั้ง 1,000 หน้านั้นและจะมองหน้าทั้งหมดนั้นมีเนื้อหาที่ใช้ทำ SEO และเกรดที่คุณจะได้จาก Google 50% จะเป็นเกรด “D” กับ “F” ทำให้คุณภาพเว็บไซต์ของคุณดูไม่ดีและอาจส่งผลต่อจำนวนผู้เข้าชมเว็บไซต์ได้
ดังนั้น Google จะใช้ XML Sitemap ของเว็บไซต์เพื่อบอกให้รู้ว่าเว็บไซต์ของคุณมีอะไร หรือมีส่วนไหนที่สำคัญ แต่หากไม่มีการทำ XML Sitemap นั่นก็ไม่ได้หมายความว่า Google ไม่มีการจัดทำดัชนีเว็บไซต์ของคุณนะ
และเมื่อพูดถึง SEO ปัจจัยสำคัญก็คือคุณภาพรวมของเว็บไซต์ ซึ่งหากต้องมีการประเมินเว็บไซต์ ให้เปิดดูรายงานที่เกี่ยวกับ Sitemap ได้ที่ Google Search Console (GSC)
ข้อควรจำ
การจัดการงบประมาณในการเก็บรวบรวมข้อมูลโดยจำกัด URL ใน Sitemap เฉพาะหน้าที่มีความเกี่ยวข้องกับ SEO จะเป็นการลดเวลาจำนวนหน้าที่มีคุณภาพต่ำบนเว็บไซต์ได้
การใช้ประโยชน์จากรายงาน Sitemap
การใช้งาน Sitemap ใน Google Search Console ไม่ได้มีข้อมูลเยอะมากมาย รายงานที่เสนอนั้น เป็นเพียงแค่บอกว่าได้ดำเนินการจัดทำ index Sitemap เว็บไซต์ของคุณเรียบร้อยแล้ว
แต่หากมีการเลือกใช้คำใช้ชื่อ URLs ที่เป็นอธิบายแทนตัวเลข จำนวนหน้าเพจที่มีการทำ SEO แล้ว Google ค้นเจอจะมันจะแตกต่างกัน
ใน Google Search Console เวอร์ชันล่าสุดนี้ หากต้องการดูค่าที่เกี่ยวกับ SEO สามารถดูได้ในรายงาน Index Coverage Report
ในรายงานค่าเริ่มต้นจะเป็น “All known pages” จะมีรายละเอียด ดังนี้
- ที่ “Error” กับ “Vavid with warnings” จะเป็นปัญหาที่เกิดจาคำสั่งของ robots ที่ขัดแย้งกัน ดูคำแนะนำและวิธีการแก้ปัญหาได้ที่ Coverage Report
- ดูแนวโน้มของการค้นหา เว็บไซต์ส่วนใหญ่จะมีการเพิ่มเนื้อหาตลอดเวลา ดังนั้น ในส่วนของหน้า “Valid” (หรือที่เรียกกันว่าหน้าที่ถูกจัดอันดับโดย Google) จะมีค่าที่เพิ่มขึ้นอยู่ตลอด ทำให้สามารถเข้าใจสาเหตุของการเปลี่ยนแปลงได้
- เมื่อคลิกไปที่ “Valid” และดูรายละเอียดของ “Indexed, not sumitted in sitemap” โดยทาง Google จะบอกว่ามีหน้าไหนที่ Google “Disagree” หรือไม่เห็นด้วย ตัวอย่างที่ Google จะ Disagree ก็ในกรณีที่ URLs ของเว็บไซต์คุณไม่ได้ทำ Privacy Policy แต่ Google ได้เข้ามาจัดเก็บหน้าเพจนี้ไปแล้ว ซึ่งจากกรณีนี้ เจ้าของเว็บไซต์ไม่ต้องทำอะไรเลย เมื่อเกิดเหตุเช่นนี้ สื่งที่เจ้าของเว็บไซต์ควรทำคือ ตรวจสอบดูว่า URLs ที่ได้ถูกจัดอันดับไปนั้นมีการจัดรูปแบบหน้าเว็ฐที่ไม่ดีหรือไม่, หรือมี parameter ที่ไม่ดี, มีเนื้อหาที่ซ้ำกัน หรือหน้าเพจถูกทิ้งออกจาก Sitemaps ไปโดยไม่ตั้งใจ
หลังจากนั้น ไปกำหนดรายงานของ URLs ที่เกี่ยวข้องกับ SEO ที่ได้เพิ่มลงไปใน Sitemapโดยคลิกเปลี่ยนจาก “All Kknow pages” ไปเป็น “All submitted pages” จากนั้นให้เช็ครายละเอียดหน้าเพจทั้งหมดที่ “Excluded”
สำหรับเหตุผลของการยกเว้นหรือ Exclusion ของ URL Sitemap มี 4 ประการคือ
- Quick wins (แผนปฏิบัติการเร่งรัด): เนื้อหาที่ซ้ำกัน, การประกาศหลัก (canoncials), คำสั่งของ Robots, รหัสแสดงสถานะ 40XHTTP, การเปลี่ยนเส้นทางหรือการยกเว้นทางกฎหมายที่มีการแก้ไขอย่างเหมาะสม
- การตรวจสอบหน้าเพจ (Investigate page): ซึ่งจะเป็นสองลักษณะก็คือ “Submitted URL dropped” – URL ของหน้านั้นถูกลบไปแล้ว กับ “Crawl anomaly” – ค้นหาแล้วเจอข้อมูลที่ผิดปกติ ซึ่งเป็นการตรวจสอบความผิดปกติผ่านเครื่องมือที่ใช้ดึงข้อมูลอย่าง เครื่องมือของ Google เป็นต้น
- การปรับปรุงหน้า (Improve page): สำหรับการเก็บรวบรวมข้อมูล – หน้าที่ยังไม่ถูกจัดทำดัชนีลำดับ (Crawled – currently not indexed) ลองดูที่เนื้อหาของเพจ (หรือประเภทของเพจ โดยทั่วไปมักจะมี URL ที่คล้ายๆ กัน) และลิงก์ภายใน ซึ่งเนื้อหาอาจจะน้อย, เป็นเนื้อหาที่ซ้ำกับที่อื่น (unoriginal content) หรือเป็นหน้าที่แตกแยกออกมาต่างหาก
- การปรับปรุงโดเมน (Improve domain): การค้นเจอ – หน้าที่ยังไม่ถูกจัดอันดับ (Discovered – currently not indexed) Google จะให้เหตุผลที่ยกเว้นว่า “พยายามค้นหา URL แล้ว แต่เว็บไซต์โหลดมากเกินไป ดังนั้น อย่าเพิ่งเชื่อ บางที Google อาจจะคิดว่า “ไม่คุ้มค่าที่จะพยายามต่อไป” เพื่อทำการค้นหาข้อมูลอย่างต่อเนื่องจาก โดเมนที่มีการจัดการลิงก์ภายในที่ไม่ดี หรือมีเนื้อหาที่ไม่มีคุณภาพ ถ้าคุณเจอข้อยกเว้นนี้บ่อยๆ ให้ลองปรับคุณภาพของ SEO ของหน้าเพจ (หรือ page type – ประเภทของหน้าเพจ) ที่ส่งเข้าไปยัง sitemaps มุ่งเน้นไปที่การเพิ่มปริมาณการเข้าถึงของ Robots และตรวจสอบโครงสร้างหน้าเว็บ รวมไปถึงพารามิเตอร์ ที่มีอยู่ในลิงก์และเนื้อหา
ไม่ว่าแผนการดำเนินการของคุณจะเป็นอย่างไร อย่าลืมจดค่า KPIs ไว้เผื่อด้วยนะ
การวัดที่มีผลกระทบต่อการปรับปรุง Sitemap นั่นก็คือ“All submitted pages” หรือทุกหน้าของเว็บไซต์ได้รับการยอมรับ ซึ่งจะคำนวณออกมาเป็นเปอร์เซนต์จากจำนวนหน้าที่ทาง Google ค้นหาเจอ
โดยหากทำตามขั้นตอนด้านบนจะได้ค่ามากกว่า 80%
สาเหตุที่ไม่ถึง 100% ก็เพราะว่า คนส่วนใหญ่จะมุ่งเน้นไปที่การทำดัชนีที่ที่เกี่ยวกับ SEO ทำให้พลาดโอกาสในการขยายข่ายของเนื้อหา
Note: หากเว็บไซต์มีขนาดใหญ่ควรแบ่งการทำดัชนี Sitemap ไว้หลายๆ อัน คุณจะสามารถกรองโดยใช้ดัชนี Sitemap เหล่านี้ได้ ซึ่งจะช่วยคุณในเรื่องต่อไปนี้
1. ดูภาพรวมในระดับที่ละเอียดยิ่งขึ้น
2. เห็นตัวอย่างที่เกี่ยวข้องมากขึ้น เมื่อมีการตรวจสอบแบบ Exclusion
3. แก้ไขปัญหาเพื่อเพิ่มประสิทธิภาพการทำดัชนีในแต่ละส่วนได้
ข้อควรจำ
นอกจาก คำแจ้งเตือนและ Error ยังสามารถใช้รายงาน Index Coverage report อย่าง XML Sitemap เป็นเครื่องมือในการตรวจสอบได้
วิธีการตรวจสอบ XML Sitemap ที่ดีที่สุด
ให้ทำการตรวจสอบ ดังนี้
- ต้องมี tag – hreflang ใน XML Sitemaps
- มี tag – <loc> และ <lastmod>
- หากต้องมีการบีบอัดไฟล์ต้องใช้ gzip
- ใช้ไฟล์ sitemap index
- ให้ใช้ Sitemaps สำหรับรูปภาพ, วิดีโอ และ Google News โดยเฉพาะ เพื่อเพิ่มค่า KPIs
- สร้าง XML Sitemap แบบ Dynamic
- เช็คให้ดีว่าได้ทำการรวม URL ไว้ใน Sitemap เดียว
- มีการอ้างอิง Sitemap index ของ URL ใน robots.txt
- มีการเพิ่ม Sitemap Index ลงใน Google Search Console และ Bing Webmaster Tools
- รวมหน้าที่ทำ SEO ใน XML Sitemap
- แก้ Error และคำเตือนทั้งหมด
- วิเคราะห์แนวโน้มและประเภทของหน้าที่ถูกต้อง
- คำนวณอัตราการจัดทำดัชนีของหน้าที่ส่งไป
- ระบุสาเหตุของการทำ Exclusion ของหน้าที่ส่งไป
ทีนี้ คุณต้องไปเช็ตเว็บไซต์ของคุณและตรวจสอบว่าได้ดำเนินการทุกขั้นตอนอย่างถูกต้องและครบถ้วนเรียบร้อยแล้ว