Các công cụ tìm kiếm như Google sẽ khám phá dữ liệu website, thu thập thêm các thông tin và giúp cho trang web của nhà quản trị website xuất hiện trên SERPs. Do kích thước và độ phức tạp của các trang web do các nhà quản trị website lạp ra ngày một tăng, Google đã phát triển một giao thức thu tập thông tin website mới vào năm 2005, được thiết lập để sử dụng vào định dạng XML. Giao thức này được gọi bằng một thuật ngữ là sitemap XML. Vậy tầm quan trọng Sitemap là gì? Cách tạo tệp sitemap XML như thế nào? Cùng chúng tôi tìm hiểu chi tiết về Sitemap và cách tạo Sitemap nhé!
Sitemap có tầm quan trọng đối với website
Việc mà liệt kê tất cả các URL của một trang webite trong Sitemap sẽ giúp trình thu thập thông tin của công cụ tìm kiếm chẳng hạn như Google sẽ phát hiện và thu thập dữ liệu tất cả các trang có trong website một cách hiệu quả hơn.
Trong sơ đồ của trang web của bạn, nhà quản trị website có thể đặt mức độ ưu tiên cho các URL này. Từ đó, các bot của công cụ tìm kiếm Google thu thập dữ liệu chỉ tập trung nhiều hơn vào các URL ưu tiên này hơn các URL khác.
Nếu bạn là nhà quản trị website thì bạn có thể sửa đổii thông tin giống như “sửa đổi cuối cùng” hoặc thay đôi tần suất “tần suất thay đổi” của một URL. Khi bạn cập nhật thông tin chi tiết này lại, trình thu thập thông tin của các công cụ tìm kiếm sẽ nhận thấy điều này. Công cụ tìm kiếm Google sẽ bắt đầu thu thập dữ liệu thông tin lại để lập chỉ mục cho bất kỳ nội dung nào đã được cập nhật, chỉnh sửa lại rồi.
Sitemap còn giúp cho bạn liệt kê tất cả URL của trang website hiện có và lập chỉ mục một cách hiệu quả. Vậy nên bạn phải biết URL là gì và cách tối ưu URL chuẩn SEO để hoàn thành thao tác này hiệu quả nhất.
Cách tạo Sitemap chi tiết cho website của bạn
Quyết định về định dạng của sitemap.xml
Một sơ đồ trang web bạn nên giới hạn ở mức 50MB (dạng không nén) và 50.000 URL. Nếu có một tệp nào lớn hơn hoặc có rất nhiều URL, việc bạn cần làm là chia danh sách của bạn thành nhiều sơ đồ trang.
Dưới đây là một ví dụ về định dạng Sitemap xml để bạn dễ hình dung:
- Đây là tiêu chuẩn mắc định, chúng được đặt ra cho giao thức hiện tại và Sitemap mở và đóng bằng thẻ này.
- Thẻ này sẽ được SEO-ers gọi theo chuyên môn là thẻ mẹ của mỗi mục nhập URL.
- Đây là URL trang website của bạn.
- Thẻ này sẽ chứa thông tin một cách cụ thể về ngày như “ngày sửa đổi cuối cùng của tệp là gì”.
- Thẻ này sẽ chứa đựng các thông tin về tần suất mà tệp sẽ thay đổi. Nó cũng sẽ là nội dung trong một website của nhà quản trị website hoặc thậm chí chỉ là một sự sửa đổi nhỏ nhất mà thôi. Nó còn có thể được cài đặt theo thời gian thành hàng giờ trong ngày, hàng ngày trong tuần, hàng tuần trong tháng, hàng tháng trong năm, hàng năm và luôn luôn kể cả không bao giờ. Thẻ này được Google đánh giá khá cao nên bạn cần chú ý.
- Thẻ này sẽ thể hiện về tầm quan trọng của một URL. Giá trị ấy có thể được tính hợp lệ trong khoảng từ 0,0 đến 1,0 theo nguyên tắc. Thẻ này sẽ thường bị Google bỏ qua không thu thập.
- Ngoài XML ra, Google cũng có hỗ trợ một số định dạng sơ đồ website khác nữa, bao gồm định dang RSS, định dạng HTML và các tệp văn bản khác,…
- Nguyên tắc chung khi nhà quản trị website tạo sitemap.
- Bạn nên sử dụng các URL nhất quán với nhau, đủ các điều kiện như ví dụ: Nếu trang web của bạn có tại địa chỉ liên kết https://www.example.com/, công cụ tìm kiếm Google ngay lúc này sẽ không chỉ định thẻ URL này là https://example.com/(bị thiếu www),…
- Sitemap của các nhà quản trị website có thể được đăng ở bất kỳ đâu trên website, điều đó cũng có nghĩa chúng có thể ảnh hưởng đến tất cả các tệp của thư mục gốc.
- Không bao gồm mã ID phiên từ các URL được thiết lập trong Sitemap.
- Việc sử dụng chú thích bằng cách hreflang để cho công cụ tìm kiếm Google biết về các phiên bản ngôn ngữ lập trình thay thế hoặc các khu vực khác nhau của URL một cách dễ dàng và hiệu quả.
- Các tệp ở định dạng XML, Sitemap phải được mã hóa bằng UTF-8 và các URL được thoát một cách thích hợp nhất có thể.
- Nhà quản trị website chỉ liệt kê các URL chuẩn mà bạn muốn chúng được hiển thị trên kết quả tìm kiếm trong sơ đồ Sitemap. Nếu bạn có hai phiên bản trang website, thì hãy chọn lọc và quyết định đặt sitemap vào môt website, thêm thẻ rel=canonical hoặc chuyển hướng trên trang website còn lại của bạn.
- Chỉ trỏ đến một phiên bản nhất định trong sitemap nếu có những URL khác nhau cho các phiên bản trên thiết bị di động hoặc phiên bản của máy tính để bàn của một trang.
- Điều hướng đến các loại phương tiện bổ sung khác ví dụ như: Các video, những hình ảnh và các trang thông tin, tin tức,… bằng cách sử các công cụ dụng tiện ích mở rộng Sitemap.
- Không được dùng chữ, số và kỹ hiệu latin cho các ký tự.
Tạo sơ đồ trang web
Một số cách bạn có thể để đưa URL vào Sitemap một cách dễ dàng, chúng cũng tùy thuộc vào kiến trúc và kích thước trang web: Tạo sơ đồ trang web bằng CMS (Content Management System), tạo Sitemap bằng cách tạo thủ công, tạo Sitemap một cách tự động.
Hướng dẫn cách tạo sơ đồ trang web với CMS
Với cách tạo bằng CMS, hệ thống đã tạo sẵn một sơ đồ trang cho các công cụ tìm kiếm chẳng hạn Google. Nếu bạn đang sử dụng các nền tảng như WordPress thì mỗi CMS sẽ có hệ thống quản lý sơ đồ trang riêng biệt. Mặc dù có một số hệ thống sẽ có thể cần một plugin. Ngoài ra, bạn cũng có thể sử dụng hình thức plugin Yoast SEO cho WordPress để có thể phân đoạn các trang, cái bài viết đăng tải lên website,..
Bạn có thể tạo sơ đồ trang web bằng cách thủ công truyền thống
Nhà quản trị website hãy mở một trình soạn thảo văn bản như Windows Notepad hoặc trình soạn thảo Nano (Linux, MacOS). Sau đó hãy nhập định dạng sitemap XML như phần trên chúng tôi đã mô tả chi tiết.
Tự động tạo sơ đồ trang web
Với các Sitemap của website có hơn vài chục URL khác nhau. Cách tốt nhất để tạo sitemap mà bạn cần làm là để cho phần mềm hề thống của trang web tạo ra nó. Nhà quản trị website có thể sử dụng một công cụ trực tuyến ưa dùng như XML-Sitemaps.com – Công cụ này sẽ thu thập các dữ liệu trang web của bạn ( có thể lên đến giới hạn 500 URL đầu tiên). Sau đó, chúng sẽ cung cấp cho bạn một sơ đồ trang XML để tải xuống ở cuối.
Cách gửi Sitemap chi tiết
Gửi sơ đồ trang thông qua Google Search Console chi tiết nhất
Nếu như đã làm thao tác xác minh trang web của mình thông qua công cụ Google Search Console. Lúc này bạn có thể gửi trang web của mình. Khi nhà quản trị website đã đăng nhập vào tài khoản Search Console và chọn trang web của chính mình, bạn sẽ cần điều hướng đến “Sơ đồ website” được tìm thấy trong danh mục bên trái nằm trong “Chỉ mục”.
Nhập URL vào sơ đồ trang web và trỏ chuột vào nút “Gửi”. Nếu Sitemap được xác minh và được định dạng một cách chính xác, nó sẽ cập nhật cho bạn với dòng trạng thái “Thành công”.
Sau khi bạn đã tạo file sitemap.xml và gửi trong công cụ Google Search Console của Google, bạn sẽ có thể truy cập vào mục “Báo cáo phạm vi sơ đồ website” và xem các lỗi đang mắc phải, các cảnh báo của website đối với sơ đồ trang web của bạn. Đây cũng có thể là các URL bị lỗi dẫn đến lỗi máy chủ (5xx), lỗi không tìm thấy (404) hoặc lỗi mã trạng thái HTTP mềm 404. Bằng việc nhận các báo cáo này cho trang website, bạn sẽ có thể tránh và tối ưu những vấn đề gây ảnh hưởng đến hiệu suất trong kết quả tìm kiếm xuất hiện trên trên các công cụ tìm kiếm.
Hướng dẫn gửi sơ đồ trang web bằng cách sử dụng tệp robots.txt
Nếu như nhà quản trị website không muốn sử dụng công cụ Google Search Console, thì bạn cũng có thể gửi Sitemap của mình đi bằng cách bỏ thêm vào nó một tệp robots.txt này. Bạn nào cần chỉ định hướng chính xác đường dẫn đến sơ đồ trang web của mình bằng cách thêm dòng sau vào bất kỳ vị trí nào có trong robots.txt.
Đây là chi tiết hướng dẫn cách tạo Sitemap cho website. Nếu bạn thấy bài viết có ích, hãy theo dõi chúng tôi đễ xem thêm những bài viết hữu ích khác nhé!