Hướng dẫn sử dụng tính năng Crawl Optimization của plugin Yoast SEO.
Có mặt trên Yoast SEO Premium kể từ phiên bản 18.6, Crawl Optimization là một tính năng rất hữu ích giúp bạn tối ưu việc thu thập dữ liệu của bots tìm kiếm và tăng tốc độ load web. Không những thế, nó còn giúp tiết kiệm tài nguyên năng lượng, giảm phát thải các-bon. Dường như cũng nhận ra điều này nên kể từ phiên bản 20.4, Yoast SEO đã chuyển nó thành tính năng miễn phí. Vậy thì Crawl Optimization là gì và cách sử dụng nó ra sao? Hãy cùng WP Căn bản tìm hiểu ngay sau đây.
Tham khảo thêm:
Crawl Optimization là gì?
Hiểu một cách đơn giản thì Crawl Optimization (Tối ưu hóa thu thập dữ liệu) làm cho website của bạn hoạt động hiệu quả hơn và thân thiện với môi trường hơn, bằng cách ngăn các công cụ tìm kiếm thu thập dữ liệu những thứ chúng không cần và loại bỏ các tính năng của WordPress mà người dùng phổ thông thường không sử dụng đến. Nhờ đó, website của bạn cũng sẽ nhẹ hơn và load nhanh hơn.
Thiết lập Crawl Optimization của Yoast SEO
Truy cập Yoast SEO => Settings => Advanced => Crawl optimization. Tại đây, các bạn sẽ thấy 6 phần, bao gồm: Remove unwanted metadata, Disable unwanted content formats, Remove unused resources, Block unwanted bots, Internal site search cleanup và Advanced: URL cleanup.
Remove unwanted metadata
WordPress thêm rất nhiều liên kết, nội dung vào <head>
và HTTP Headers của website. Đối với hầu hết các trường hợp, bạn có thể tắt tất cả những thứ này một cách an toàn. Điều này có thể giúp tiết kiệm băng thông, điện và cây xanh.
Trong đó:
- Remove shortlinks: xóa các shortlink nội bộ của WordPress cho bài viết hoặc trang.
- Remove REST API links: xóa các liên kết đến REST API của WordPress.
- Remove RSD / WLW links: xóa các liên kết được sử dụng bởi các hệ thống bên ngoài để xuất bản nội dung lên website của bạn.
- Remove oEmbed links: xóa các liên kết được sử dụng để nhúng nội dung của bạn trên các website khác.
- Remove generator tag: xóa thông tin về phiên bản WordPress được sử dụng bởi website của bạn.
- Pingback HTTP header: xóa các liên kết cho phép các website khác “ping” website của bạn khi họ liên kết đến bạn.
- Remove powered by HTTP header: xóa thông tin về phiên bản PHP được sử dụng bởi website của bạn.
Tham khảo thêm: Làm sạch Header của WordPress giúp website load nhanh hơn
Disable unwanted content formats
WordPress xuất nội dung của bạn ở nhiều định dạng khác nhau, trên nhiều URL khác nhau (chẳng hạn như RSS Feed của bài viết và danh mục). Nói chung, nên tắt các định dạng bạn không sử dụng.
Trong đó:
- Remove global feed: xóa liên kết RSS Feed của trang chủ.
- Remove global comment feeds: xóa liên kết RSS Feed bình luận của trang chủ.
- Remove post comments feeds: xóa liên kết RSS Feed bình luận của bài viết.
- Remove post authors feeds: xóa liên kết RSS Feed của tác giả.
- Remove post type feeds: xóa liên kết RSS Feed của các loại bài viết tùy chỉnh.
- Remove category feeds: xóa liên kết RSS Feed của chuyên mục.
- Remove tag feeds: xóa liên kết RSS Feed của thẻ.
- Remove custom taxonomy feeds: xóa liên kết RSS Feed của phân loại bài viết tùy chỉnh (ví dụ như danh mục sản phẩm, thẻ sản phẩm).
- Remove search results feeds: xóa liên kết RSS Feed của trang kết quả tìm kiếm.
- Remove Atom / RDF feeds: xóa liên kết của các định dạng RSS Feed cũ như Atom hay RDF.
Nếu bạn đang sử dụng Google News hoặc các dịch vụ thông báo bài viết mới qua email thì nên kiểm tra cẩn thận từng mục trước khi vô hiệu hóa để tránh bị lỗi nhé.
Tham khảo thêm: Vô hiệu hóa RSS Feed trong WordPress một cách đơn giản
Remove unused resources
WordPress tải rất nhiều tài nguyên, một số trong số đó có thể website của bạn không cần. Nếu bạn không sử dụng những thứ này, việc xóa chúng có thể tăng tốc độ load và tiết kiệm tài nguyên.
Trong đó:
- Remove emoji scripts: xóa file JS được sử dụng để chuyển đổi các ký tự biểu tượng cảm xúc trong các trình duyệt cũ (Emoji).
- Remove WP-JSON API: chặn index WP-JSON API (REST API).
Tham khảo thêm: Loại bỏ Emoji để tăng tốc độ load cho website WordPress
Block unwanted bots
Rất nhiều lưu lượng truy cập web đến từ các bots thu thập dữ liệu. Một số có thể mang lại lợi ích cho website hoặc doanh nghiệp của bạn, trong khi những bots khác thì không. Chặn các bots không mong muốn có thể tiết kiệm năng lượng, giúp cải thiện hiệu suất website và bảo vệ nội dung có bản quyền.
Trong đó:
- Prevent Google AdsBot from crawling: chặn Google AdsBot (bots chạy quảng cáo Google).
- Prevent Google Bard and Vertex AI bots from crawling: chặn bots của Google Bard và Vertex AI. Tính năng này chỉ có trên Yoast SEO Premium.
- Prevent OpenAI GPTBot from crawling: chặn bots của OpenAI (ChatGPT). Tính năng này chỉ có trên Yoast SEO Premium.
- Prevent Common Crawl CCBot from crawling: chặn Common Crawl CCBot. Tính năng này chỉ có trên Yoast SEO Premium.
Tham khảo thêm: Mẫu file robots.txt chuẩn dành cho website WordPress
Internal site search cleanup
Tính năng tìm kiếm nội bộ có thể tạo ra nhiều URL gây nhầm lẫn cho các công cụ tìm kiếm và thậm chí có thể bị những kẻ spam index SEO lợi dụng để tấn công website của bạn. Hầu hết các website sẽ được hưởng lợi từ việc thử nghiệm các biện pháp bảo vệ và tối ưu hóa này, ngay cả khi bạn không có tính năng tìm kiếm trong giao diện của mình.
Trong đó:
- Filter search terms: kích hoạt tính năng lọc tìm kiếm.
- Max number of characters to allow in searches: giới hạn độ dài của các truy vấn tìm kiếm nội bộ để giảm tác động của các cuộc tấn công spam index và URL gây nhầm lẫn.
- Filter searches with emojis and other special characters: chặn tìm kiếm nội bộ chứa các ký tự phức tạp, không phải chữ và số, vì chúng có thể là một phần của cuộc tấn công spam index.
- Filter searches with common spam patterns: chặn tìm kiếm nội bộ khớp với các mẫu tấn công spam index đã biết.
- Redirect pretty URLs to ‘raw’ formats: chuyển các định dạng URL tìm kiếm khác thành cú pháp
?s=
. - Prevent crawling of internal site search URLs: chặn index các trang kết quả tìm kiếm nội bộ.
Tham khảo thêm: Xử lý spam index trong Google Search Console
Advanced: URL cleanup
Người dùng và công cụ tìm kiếm thường có thể yêu cầu URL của bạn trong khi sử dụng các tham số truy vấn, như ?color=red
. Những điều này có thể hữu ích để theo dõi truy cập, lọc và sử dụng các chức năng nâng cao, nhưng chúng đi kèm với hạn chế về hiệu suất và SEO. Các website không dựa vào các tham số URL có thể hưởng lợi từ việc sử dụng các tùy chọn này.
Trong đó:
- Optimize Google Analytics utm tracking parameters: thay thế các tham số theo dõi
?utm
bằng#utm
với hiệu suất cao hơn thông qua redirect 301. - Remove unregistered URL parameters: xóa các tham số URL không xác định thông qua redirect 301. Tôi khuyên bạn không nên bật tính năng này vì nó rất dễ gây lỗi tính năng của website.
Sau khi thiết lập xong, hãy xóa cache website (nếu có) và kiểm tra kết quả. Thật tuyệt vời phải không nào? Chúc các bạn thành công!
Bạn có đang sử dụng tính năng Crawl Optimization của Yoast SEO không? Bạn đánh giá thế nào về nó? Hãy cho chúng tôi biết ý kiến của bạn thông qua khung bình luận bên dưới.
Nếu bạn thích bài viết này, hãy theo dõi blog của tôi để thường xuyên cập nhật những bài viết hay nhất, mới nhất nhé. Cảm ơn rất nhiều. :)
Để lại một bình luận