Hướng dẫn xử lý và ngăn ngừa tình trạng spam index trong Google Search Console.
Gần đây, một số bạn có liên hệ hỏi tôi về tình trạng trong Google Search Console xuất hiện những URL lạ. Những URL này là liên kết nội bộ của website nhưng lại có chứa các từ khóa, tên miền… hoàn toàn không liên quan. Để cho ngắn gọn, tôi gọi đây là tình trạng spam index. Vậy thì cụ thể spam index là gì? Làm thế nào để xác định được website của bạn có đang gặp phải tình trạng này hay không? Spam index dẫn đến những hậu quả nào và cách xử lý nó ra sao? Hãy dành ít phút để cùng WP Căn bản tìm hiểu ngay sau đây.
Tham khảo thêm:
Spam index là gì?
Spam index là tình trạng Google Bots lập chỉ mục những URL có chứa từ khóa hoặc nội dung hoàn toàn không liên quan tới website của bạn. Đây là chiêu trò của các “chuyên gia SEO bẩn” thường dùng để đẩy từ khóa lên top. Chúng phần lớn được tạo ra bởi các con bots một cách hoàn toàn tự động.
Để biết website của bạn có gặp tình trạng spam index hay không, hãy truy cập Google Search Console => Lập chỉ mục => Trang => click vào nút Xem dữ liệu về các trang đã được lập chỉ mục. Nếu bạn nhìn thấy những URL với những query string lạ như hình bên dưới thì có nghĩa website của bạn đã trở thành một “nạn nhân” của spam index.
Ngoài ra, các bạn cũng có thể thử tìm kiếm trên Google với cú pháp site:yourdomain.com
. Trong đó, yourdomain.com
là tên miền của bạn. Nếu trang tìm kiếm xuất hiện nhiều kết quả mà bạn không mong muốn (khi truy cập thường xuất hiện lỗi 404) thì website của bạn cũng đã bị spam index.
Tác hại của spam index
Việc spam index có thể dẫn đến một số hậu quả như:
- Lãng phí tài nguyên của Google Bots. Thay vì index những trang mà bạn muốn, giờ đây Google lại mất thời gian để index những trang mà bạn không cần.
- Trong trường hợp website của bạn bị spam index thông qua khung tìm kiếm, thậm chí hậu quả còn tệ hại hơn khi nội dung spam xuất hiện luôn trên website của bạn. Google có thể hiểu nhầm website của bạn có chứa nội dung độc hại, từ đó ảnh hưởng xấu đến SEO.
- Khách hàng sẽ đánh giá thấp website của bạn vì cho rằng chúng không an toàn => giảm tỉ lệ click vào kết quả tìm kiếm và tỉ lệ mua hàng.
- Giảm tỉ lệ click vào kết quả tìm kiếm vì các kết quả hàng đầu đã bị các trang spam chiếm mất.
Khắc phục tình trạng spam index
Trước tiên, hãy xác định xem website của bạn có bị hack hãy nhiễm mã độc không?
- Nếu bạn bị spam index dạng query string (có dấu
?
trong URL) hoặc khi truy cập link spam thì bị báo lỗi 404 thì nhiều khả năng website của bạn không bị hack hay nhiễm mã độc. - Nếu bạn bị spam index dạng subdomain (
abcxyz.yourdomain.com
) thì nhiều khả năng website của bạn không bị hack hay nhiễm mã độc. Vấn đề xuất phát từ DNS của tên miền. - Nếu bạn bị spam index không có query string và URL spam có thể truy cập bình thường (không bị báo lỗi 404) thì nhiều khả năng website đã bị hack hoặc nhiễm mã độc. Bạn sẽ cần phải xử lý mã độc và các lỗ hổng bảo mật trên website trước khi xử lý spam trên Google.
Tham khảo dịch vụ quét mã độc WordPress miễn phí của chúng tôi nếu bạn không có kinh nghiệm về xử lý mã độc. Chúng tôi hỗ trợ xử lý mã độc miễn phí cho các website sử dụng dịch vụ WordPress Hosting do WP Căn bản cung cấp.
1. Đầu tiên, các bạn cần phải truy cập Google Search Console => Xóa URL => Các yêu cầu xóa tạm thời => click vào nút Yêu cầu mới. Một khung pop-up sẽ hiện lên => điền URL spam vào khung => chọn Chỉ xóa URL này => click vào nút Tiếp.
Click vào nút Gửi yêu cầu để xác nhận.
Làm tương tự với những URL khác cho đến hết. Sau khi làm xong, các bạn sẽ cần phải chờ một thời gian để Google thực hiện yêu cầu. Những URL đã ẩn khỏi kết quả tìm kiếm sẽ có trạng thái Đã xóa tạm thời.
Trên mạng có một số tiện ích mở rộng (extension) của trình duyệt Google Chrome có thể hỗ trợ xóa index hàng loạt, chẳng hạn như Google Search Console – Bulk URL Removal. Tuy nhiên, chúng không phải là sản phẩm chính chủ của Google nên vẫn tiềm ẩn nhiều nguy cơ. Do đó, chúng tôi khuyên bạn nên cân nhắc kỹ trước khi cài đặt và sử dụng.
2. Những URL mà bạn vừa yêu cầu xóa khỏi Google sẽ chỉ bị tạm ẩn trong vòng 6 tháng. Nếu muốn ngăn chúng hiển thị trở lại, bạn phải ngăn Google lập chỉ mục chúng một lần nữa bằng cách:
Đối với spam index dạng query string
Thêm dòng sau đây vào trong file robots.txt: Disallow: *?*
Điều này sẽ giúp ngăn chặn Google index các URL có query string (dấu chấm hỏi). Tuy nhiên, nếu site của bạn đang cài những plugin như LiteSpeed Cache thì nó sẽ chặn Google thu thập các file CSS và JS do LiteSpeed Cache tạo ra, dẫn đến lỗi vỡ giao diện (không thân thiện với thiết bị di động). Do đó, hãy thay thế dòng bên trên bằng các dòng lệnh cụ thể (tùy theo từng trường hợp). Ví dụ:
- Nếu bạn muốn chặn index các trang kết quả tìm kiếm mặc định của WordPress, hãy sử dụng:
Disallow: /?s=*
- Nếu bạn muốn chặn index các link có chứa
?demo=
, hãy sử dụng:Disallow: *?demo=*
- Nếu bạn muốn chặn index các link có chứa
?main_page=
, hãy sử dụng:Disallow: *?main_page=*
Làm tương tự cho những trường hợp khác.
Riêng đối với các subpages, các bạn có thể tham khảo thêm bài viết: Làm thế nào để chặn index subpages trong WordPress?
Đối với spam index dạng subdomain
Nếu website của bạn bị dính spam index dạng subdomain. Hãy kiểm tra lại các record DNS của tên miền xem có record nào đặt tên là *
hay không. Nếu có thì hãy xóa nó đi. Record này là một “lỗ hổng” để hacker lợi dụng nhằm spam index dạng subdomain. Nếu không có record này thì các subdomain spam kia sẽ không thể truy cập được => Google cũng sẽ không index chúng.
Lưu ý: trường hợp này website hoàn toàn không bị hack hay bị dính mã độc. Cũng không có subdomain thực nào được tạo trên trang quản lý DNS domain của bạn. Hacker đơn giản là lợi dụng record *
(đại diện cho tất cả subdomain) để cho phép tạo subdomain ngẫu nhiên (ảo) và dùng thủ thuật để ép Google index nó lên kết quả tìm kiếm với nội dung mà chúng mong muốn.
Tiến hành đổi mật khẩu trang quản trị DNS tên miền và bật xác thực 2 bước nếu bạn nghi ngờ thông tin đăng nhập đã bị lộ.
Ngoài ra, chúng tôi cũng khuyến khích bạn nên chuyển qua sử dụng CloudFlare DNS để có khả năng bảo mật tốt hơn, tốc độ phản hồi nhanh hơn và ổn định hơn. Tham khảo bài viết: Tại sao bạn nên sử dụng CloudFlare DNS cho website?
3. Ngoài ra, các bạn cũng nên redirect 301 các URL spam về trang chủ hoặc trang gốc của nó bằng cách sử dụng các plugin như Yoast SEO Premium hay Redirection.
Ngăn spam tìm kiếm trong WordPress
Nếu website của bạn bị spam index thông qua khung tìm kiếm của WordPress, ngoài các công việc ở trên, các bạn cần phải:
- Vô hiệu hóa tính năng tìm kiếm mặc định của WordPress nếu nó không quá cần thiết. Các bạn có thể sử dụng plugin Disable Search để làm điều này.
- Thay thế tính năng tìm kiếm mặc định của WordPress bằng dịch vụ của bên thứ ba, chẳng hạn như Google Custom Search. Những dịch vụ này thường cho phép bạn thay đổi URL của trang kết quả tìm kiếm, từ đó chống được tình trạng spam bằng bots. Nó giống như việc bạn đổi link đăng nhập WordPress để chống brute force attack vậy. Tham khảo thêm: Tích hợp công cụ tìm kiếm Google cho theme Paradise.
- Cài đặt plugin chống spam cho website, chẳng hạn như Akismet (miễn phí), AntiSpam Bee (miễn phí) hoặc CleanTalk (trả phí).
- Truy cập Yoast SEO => General => Crawl settings => Search cleanup settings và bật tất cả các tính năng Filter search terms, Filter searches with emojis and other special characters, Filter searches with common spam patterns lên, nếu bạn đang dùng Yoast SEO Premium (kể từ phiên bản 18.8 trở đi) trên website của mình.
Cuối cùng là chờ Google cập nhật dữ liệu thôi. Thật đơn giản phải không nào? Chúc các bạn thành công!
Site của bạn có gặp phải tình trạng spam index như tôi vừa đề cập ở trên không? Bạn đã làm gì để khắc chúng? Hãy chia sẻ với chúng tôi kinh nghiệm của bạn thông qua khung bình luận bên dưới.
Nếu bạn thích bài viết này, hãy theo dõi blog của tôi để thường xuyên cập nhật những bài viết hay nhất, mới nhất nhé. Cảm ơn rất nhiều. :)
Em chào anh ạ, Website của em hiện đang bị lỗi spam index, các url thường có dạng “https://greenlife.pro.vn/accessori-acquario-acqua-dolce-63168/”
Em tạo file robots Disallow: *accessori* như này có đúng không ạ, hay phải làm cách nào khác ạ. Em cảm ơn ạ
Với trường hợp này thì bạn redirect 301 các link 404 về trang chủ hoặc link tương tự là được nhé. Tham khảo bài viết: Redirect trang bị lỗi 404 về trang chủ trong WordPress
Ngoài ra, để an toàn, bạn cũng nên quét lại mã nguồn để đảm bảo nó không nhiễm mã độc hay bị hack thông tin đăng nhập (mặc dù khả năng này không cao).
ok bác
Các bạn cho hỏi: Robots.txt chỉ cho lập chỉ mục trang chủ, không cho lập chỉ mục tất cả các subdomain (kiểu như abcdef.domain.com) thì phải cấu hình lệnh hoặc cài đặt như thế nào Ad ?
Bạn bị spam index subdomain hay sao nhỉ? Nếu bạn bị spam index subdomain thì vào trang quản lý DNS của tên miền kiểm tra xem có record nào tên là * không? Nếu có thì xóa nó đi. Vấn đề này đã được bên mình đề cập tại đây.
Còn nếu bạn muốn chặn index các subdomain do chính bạn tạo thì bạn phải tạo cho mỗi subdomain đó 1 file robots.txt riêng với nội dung:
cho hỏi file chặn subdomain mình điền như này đúng chưa bạn
User-agent: *
Disallow: /adc.webcuatui.com
như này đúng k bạn
Theo như mình biết thì nếu muốn chặn index subdomain, bạn cần phải tạo file
robots.txt
với nội dung:Và upload nó vào thư mục gốc của subdomain. Bạn không thể chặn index subdomain thông qua file
robots.txt
của domain chính được đâu.subdomain này là mình tạo ở dns CF không có file thư mực, thì có cần dis không nhỉ, nó có ảnh hưởng gì đến seo k b nhỉ, thấy bot truy cập vào subdomain đó cũng nhiều
Nếu subdomain không có dữ liệu thì mục đích bạn tạo nó là để làm gì nhỉ?
làm link chứa file ảnh đó bạn domain custom amz s3
Nếu thế thì mình nghĩ không cần thiết phải chặn đâu bạn.
Chào bạn, bạn có thể tư vấn giúp mình cách seo web không?
Chỗ nào nhỉ, mình ko thấy “Phạm vi lập chỉ mục” ở đâu
Google Search Console nó đổi giao diện rồi. Bạn vào Lập chỉ mục => Trang => kiểm tra trong Xem dữ liệu về các trang đã được lập chỉ mục và Đã lập chỉ mục mặc dù bị chặn bởi robots.txt nếu có.
Hix Hix…! Mình Tận 17k Xóa đến bao giờ đây hiếu ơi
Hiếu có cách nào nhanh hơn bạn chứ lâu lâu mới để ý thấy mà khiếp vía :(
Mong Hiếu sớm phản hồi à mà tớ sài rank math reo kinh doanh của cty hosting nó miễn phí..
Yoast SEO Premium có tính năng “Permalink cleanup settings” để tự động redirect link có query string về link gốc. Còn Rank Math thì mình không biết vì không dùng. :P
Yoast SEO Premium khá max ziền ( quan trong nữa là rất nhiều bài viết sửa tay đến bao giờ đây. Mà tớ chỉ nghe nói từ Yoast SEO sang rankmathseo ngược lại thì không, 1 đống Keyword nhìn sửa mà …haizz)
Giờ thì kệ thui hay lọc cọc sửa 17k đây hiếu cho xin ý kiến phát
Yoast SEO có hỗ trợ import dữ liệu từ Rank Math nhé. Bên mình có tặng kèm miễn phí Yoast SEO Premium (bản mới nhất) cho các khách hàng có nhu cầu luôn. :3
Bác cho hỏi với, nó spam index 1000 link thì có cách nào xóa url trong webmaster không, chứ xóa tay từng link thì khoai quá.
Xóa tay thôi bạn. Không có cách nào khác cả. :P
Khi bị như này, thì theo bác giải pháp để khắc phục thứ hạng thì phải làm gì, rất mong bác chia sẻ
Loại bỏ những link spam rồi chờ Google họ cập nhật lại từ từ chứ mình cũng không biết làm gì hơn. :)
cảm ơn bác
Hình như yoast premium bản 18.8 có chức năng lọc spam rồi, đang ở chế độ beta không biết có ổn không. Mình vừa bật xong
Đúng rồi bạn. Có vẻ Yoast SEO cũng đã phát hiện ra tình trạng spam trong thời gian gần đây. :D
Vừa nâng cấp xong mình bật chức năng tìm kiếm luôn, đang để cho phép tìm kiếm 20 ký tự vs bật lọc các kí tự đặc biệt. giờ chờ xem bên GSC báo thế nào, k biết có dc k
Có gì thì phản hồi lại tình hình cho mọi người cùng biết nhé. :P
ok bác, đang chờ 4-5 hôm sẽ có kết quả thôi
Đang có kết quả tốt bác nhé. Link spam GSC càng ngày càng giảm rồi
Ngon. Vậy chắc phải cập nhật vào trong nội dung bài viết.
Bá đạo thật, mình tắt chức năng tìm kiếm, chặn robots.txm, chuyển hướng 404 rồi mà link google báo vẫn cứ tăng.
Bạn làm lâu chưa? Mình đã giảm được hơn trăm link kể từ hôm làm. Giảm từ 832 xuống 678. :P
làm dc 2 tuần rồi mà vấn cứ tăng, không hiểu sao, xóa chức năng tìm kiếm rôi, khi truy cập link đó thì 404 và m đã cho về trang chủ. bó tay thật
Bạn kiểm tra kỹ xem có phải nó tăng kiểu spam tìm kiếm như trước không? Hay là nó spam bằng cấu trúc khác?
Vấn là 1 dạng linh doman/?s= phía sau, k hiểu sao khi truy cập các link này nó chuyển về trang chủ rồi mà google vấn tính, đã tắt chức năng tìm kiếm vs chặn ở tệp robots rồi, m đã vào GSC xóa link bắt đầu bằng ?s= mà vẫn k mất cho mới cay chứ
Google cũng ảo ma quá. Riêng cái khoản đã chặn bằng robots.txt mà vẫn index là thấy không tuân thủ quy tắc rồi. :P
Mình cũng bị tình trạng như bạn này. Cũng chặn robot txt, Xoá bỏ luôn mục search, chuyển các link không đúng về 404 mà link trong webmaster vẫn bị báo tăng. @Sáng bạn khắc phục được chưa?
Bên dưới bạn ấy có phản hồi kìa bạn. Dùng tính năng chống spam tìm kiếm của Yoast SEO Premium thì số link spam đã giảm dần.
Cảm ơn bro, mình chưa gặp trường hợp này nhưng xem sơ hướng dẫn của bạn khá chi tiết. Một số anh em dùng rankmath nữa nên bro cân nhắc update cả hướng dẫn rankmath vô nhé.
Rank Math có sẵn tính năng Noindex Paginated Pages rồi bác. Nên không cần dùng code nữa. Không hiểu sao ông Yoast SEO lại mặc định loại bỏ nó đi. :P
Đúng rồi, bảo sao mình xài Rank math không dính mà thấy anh em kêu hoài luôn