Top 7 công cụ miễn phí, tốt nhất giúp kiểm tra lỗi trùng lặp nội dung cho website.

Content scraping (“đạo” nội dung) là một vấn đề nghiêm trọng và nhức nhối hiện nay. Nó đã trở thành một trong những hành vi rất phổ biến trên internet. Bất cứ ai cũng có thể dễ dàng sao chép nội dung của bạn và đăng tải nó vào trang web của họ mà không có sự cho phép. Các trang web “đạo” nội dung tạo ra rất nhiều nội dung trùng lặp. Nó làm giảm độ tin cậy đối với nội dung gốc của bạn và bạn có thể bị trừng phạt bởi Google vì lỗi trùng lặp nội dung. Vì vậy, sẽ tốt hơn, nếu bạn thường xuyên kiểm tra xem nội dung của bạn có bị một ai đó ăn cắp hay không?
Tham khảo thêm:
- Liệu có nên chèn logo DMCA vào website của bạn?
- Làm thế nào để báo cáo vi phạm bản quyền lên Google?
7 Công cụ kiểm tra lỗi trùng lặp nội dung miễn phí
Trong bài viết này, tôi sẽ chia sẻ với các bạn 7 công cụ miễn phí giúp kiểm tra và phát hiện nội dung trùng lặp. Các công cụ này giúp bạn kiểm tra tính nguyên bản của một bài viết hoặc tìm ra những trang đã sao chép bài viết của bạn.
Google Search

Sử dụng Google Search là cách dễ nhất để tìm thấy những trang web đã sao chép nội dung của bạn. Tất cả những gì bạn cần làm là copy một cụm từ hoặc một câu từ bài viết trên blog/ website của bạn và thực hiện tìm kiếm trên Google. Google sẽ hiển thị tất cả các nội dung có chứa cụm từ hoặc câu mà bạn muốn tìm kiếm.
Copyscape

Copyscape là công cụ kiểm tra “đạo” nội dung phổ biến nhất hiện nay. Nó cho phép bạn tìm kiếm các bản sao nội dung trên web. Bạn chỉ cần nhập URL bài viết trên website của bạn để tìm hiểu xem liệu có nội dung trùng lặp trên internet hay không? Bạn có thể kiểm tra miễn phí một số ít nội dung mỗi ngày. Nếu muốn kiểm tra rất nhiều nội dung, bạn cần phải có tài khoản Copyscape trả phí.
Dupli Checker

Dupli Checker là công cụ yêu thích của cá nhân tôi. Đây là một công cụ phát hiện “đạo” nội dung miễn phí. Nó cho phép thực hiện tối đa 50 tìm kiếm mỗi ngày, nếu bạn là một thành viên đã đăng ký. Nó rất dễ sử dụng. Chỉ cần nhập nội dung của bạn (tối đa là 1.500 từ) hoặc tải lên tập tin văn bản có đuôi .docx hoặc .txt và sau đó bấm nút Search. Bạn sẽ nhận được các báo cáo phân tích trong vòng một vài giây.
Plagiarisma

Plagiarisma cho phép bạn kiểm tra nội dung trùng lặp bằng cách nhập văn bản hoặc URL. Nó hỗ trợ hơn 190 ngôn ngữ khác nhau. Để kiểm tra nội dung trùng lặp, hãy nhập văn bản vào khung hoặc điền URL vào mẫu và click nút Check Duplicate Content. Nó sẽ hiển thị nội dung gốc bằng màu vàng và nội dung trùng lặp bằng màu xám. Nó cũng cung cấp một phần mềm chuyên dụng dành cho máy tính.
Article Checker

Article Checker là một công cụ kiểm tra trùng lặp nội dung miễn phí. Bạn có thể quét các trang web để tìm ra những những trang đã sao chép nội dung của bạn. Nó cung cấp cả hai phương thức kiểm tra: văn bản và URL. Chỉ cần nhập văn bản hoặc URL và bấm nút Compare.
Web SEO Anayltics

Công cụ này cho phép bạn so sánh hai URL để kiểm tra mức độ trùng lặp nội dung giữa chúng. Nó có thể rất hữu ích nếu bạn đang có ý đính gửi báo cáo lên DMCA để yêu cầu gỡ bỏ nội dung sao chép. Nó giúp bạn xác định tỷ lệ phần trăm giống nhau giữa hai bài viết.
Google Webmaster Tools
Google Webmaster Tools (hay Google Search Console) không phải là một công cụ kiểm tra nội dung trùng lặp. Nhưng nó có thể giúp bạn tìm ra các trang web ăn cắp nội dung. Chỉ cần truy cập Webmaster, click vào Lưu lượng tìm kiếm => Các liên kết tới trang web của bạn và kiểm tra xem những trang web nào liên kết đến website của bạn nhiều nhất.

Nếu có bất kỳ trang web nào liên kết rất nhiều đến website của bạn và chúng không phải là mạng xã hội hay các trang bookmark, thì đó có thể là một trang web copy nội dung. Việc còn lại là truy cập vào trang web đó và kiểm tra xem nó có sao chép nội dung của bạn hay không?
Hy vọng, với các công cụ kể trên, các bạn có thể nhanh chóng tìm ra những kẻ ăn cắp công sức, ăn cắp chất xám và có hình thức bảo vệ tốt hơn với các bài viết của mình.
Nếu bạn thích bài viết này, hãy theo dõi blog của tôi để thường xuyên cập nhật những bài viết hay nhất, mới nhất nhé. Cảm ơn rất nhiều. :)






Thanks for useful list of resources!
In my opinion, all of the above are great free plagiarism checkers. The one you select will heavily depend on its user interface and other personal touches.
That being said, it is tough to measure just how accurate these are when compared to one another. If you are unsure about any of them, I would alternatively suggest a premium Grammarly account, which appears to have a great reputation among publishers.
Trước giờ minh thường sử dụng smallseotool cho việc kiểm tra nội dung trùng lập, nhưng dạo gần đây nó thường bị lỗi. Nên việc kiểm tra cang mất nhiều thời gian với nhiều công cụ khác trên gg hay diễn đàn là cần đký hay là mua gi đấy. Không biết có bac nào có tool nào miễn phí giông be smallseotool này không cho mình xinh cái link. Đang cần để check cho website: http://inhaxinh.com/ mà mình đang seo, bữa giờ toàn đăng bừa không check được
Bạn có thể thử CopyScape nhé. :P
Smallseotool nó bị làm sao ấy. Bài của mình ở http://mekongtrails.com/places-cycling-vietnam đã được google index rồi mà khi copy bài dán lên đó mà nó vẫn báo 100% unique
Mình thường hay dùng check content của smallseotools nhưng dạo này hay bị lỗi quá trời
Chắc để thử mấy công cụ trên này xem sao
Nội dung tập tin robots chỉ disallow admin và includes thôi bạn.
Thế thì mình chịu. Cái này mình cần xem cụ thể các thiết lập SEO của bạn thì mới có thể tìm ra nguyên nhân chính xác được. :P
Bạn thử khôi phục lại mặc định của Yoast xem còn bị không
Hôm nay mình đã chính thức làm xong website, và publish cho chạy rồi. Nhưng khi mình dùng SEO doctor (bản cập nhật mới nhất 1.6.5.1) để tối ưu hóa web thì các trang khác đều ok, riêng trang chủ thì SEO doctor báo:
Page is not indexable because This page has a canonical URL set to [http://lapxuongmientay.com]
HTML:
HTTP: X-Robots-Tag: noindex
robots.txt: User-agent: * Dissallow:/
HTML:
Mình đã tìm hiểu cách hướng dẫn trên nhiều diễn đàn, nhưng vẫn không thay đổi được gì. Mình sử dụng plugin seo Yoast cho website. Bạn vui lòng xem wa web mình, nếu phát hiện được cách sửa, bạn hướng dẫn giúp mình nhé.
Theo như mình đọc ở nhiều diễn đàn, thì rất có thể web mình bị trùng lặp nội dung ở các URL khác nhau. Theo mình đó là 3 link sau:
http://lapxuongmientay.com
http://lapxuongmientay.com/trang-chu
http://lapxuongmientay.com/lap-xuong-tuoi.html (đó là link bài post duy nhất trên trang chủ, mình đã redirect nó về trang chủ rồi)
3 trang này nội dung hoàn toàn giống nhau.
Thanks !
Bạn kiểm tra lại nội dung tập tin robots.txt xem có chặn index trang chủ không nhé. :P
cho em hỏi làm thế nào để báo google là website khác ăn cắp nội dung
Bạn tham khảo bài viết này nhé: https://wpcanban.com/wordpress/thu-thuat-wordpress/lam-the-nao-de-bao-cao-vi-pham-ban-quyen-len-google.html
công cụ này khá hay
Dùng cú pháp site:chaomaohot.net để tìm kiếm trên Google xem kết quả thế nào?
Nhờ bác hiếu vào tư vấn giúp,không hiểu sao hôm nay mình mất sạch thứ hạng trên google vậy.Không còn từ khóa nào luôn.Trong khi bình thường đánh tất cả cái gì liên quan đến ” chào mào” là nằm top.Mình thường vào xem lúc nào cũng 70 người,bây giờ còn có 10 người,không biết nguyên nhân là gì,vào webmaster đâu thấy spam gì đâu
Chắc là dính sandbox rồi.
Vừa check thử. Thấy không bị dính sandbox. Có khi nào là do cái diễn đàn không? @@!
Không biết phải diễn đàn không nữa.Vào mấy trang SEO thấy người ta cũng bị,webmaster không thấy thông báo gì hết.Mấy từ khóa vip giờ không còn 1 từ nào.Hôm qua vừa mới viết bài thấy nó index liền luôn,hôm nay mất sạch.Annalytics thời gian thực lúc nào cũng 70_80,giờ còn 7,8 người.Kiểu này visit từ 6k2 xuống còn 1k quá,vãi
Có lẽ nào cái diễn đàn bị dính lỗi nội dung kém chất lượng không? @@!
Thím thử vào trang này check thử xem có bị dính sandbox không: http://www.searchenginegenie.com/sandbox-checker.htm (Mục thứ 1 nhập tên miền. Mục thứ 2 nhập từ khóa. Mục thứ 3 nhập mã Captcha).
Ax bị sandboxt hả ” Your site is still in google Sandbox. Contact support@searchenginegenie.com to get you out of Sandbox. ” trang này có tin tưởng được không thế.Từ khóa nào không có thì nó nói sandbox,mà tôi mất từ thứ hạng cao nhất ” chim chao mao,chao mao,chao mao hot”
Vậy là xong. Đứt phim. R.I.P trang của thím. :P
Thôi con lạy Thím,trang đó tính ngu bỏ mịa,từ nào không có top thì báo sandbox,gio đánh thử trang ông,rồi từ khóa ông đang SEO mà chưa vào top xem nó có báo sandbox không?Cái này là do Google dance nó cập nhật từ ngày 20-24/08 thôi,mà trang tôi hôm nay mới bị,mất từ khóa chính
Đừng cố tự an ủi bản thân nữa. Chấp nhận sự thật phũ phàng đê. :D :D :P
Sau 1 ngày thì traffic từ 6k2 con 2k6.Trước khi bị có làm 3 cái.Đổi ip host liên tục(do thằng bkns nâng cấp,đổi 4 lần).Thêm 1 chuyên mục VIDEO.Trỏ trang blogspot về(đã hủy trỏ,lúc trước trỏ không sao).Và thấy video youtube cũng bị thay đổi,đánh từ khóa “chao mao hot” thì nó ra video khác
Spam cái nữa là trang blogspot là trang vệ tinh toàn copy bài vậy mà lên top loạn xạ luôn.Đi mấy diễn đàn SEO thấy người ta cũng bị nhưng 1,2 ngày là về lại.hi vọng ngày mai e nó về,chứ giờ về cũng không đủ bw cho tháng này,hết 55g rồi
Bỗng muốn khóc cho lòng nhẹ nỗi đau… Sao Cường khóc? Cứ khóc cho vơi đi… :D Đùa chứ tôi nghĩ mấy cái chuyên mục video với redirect không ảnh hưởng gì đâu. Chắc do Google đang có sự thay đổi gì đó thôi. :P
Bỗng muốn khóc cho lòng nhẹ nỗi đau. Sao em không cứ khóc cho vơi đi. Vẫn biết thế nhưng lòng chợt đau thắt. Chuyện vui em hãy giữ cho nỗi buồn đừng qua đây. Khi đêm còn lại trong kí ức.
Mua VPS đi ba. Băng thông Unlimited. Traffic như của ông thì xài shared host làm chi cho mệt đầu. :P
Hay. Có cần em vote cho không ? :D
Vote 3 sao nữa tôi cắt chym của cậu đó. :D
Plugin vote trong mỗi bài viết tên gì vậy bạn ?
Là plugin KK Star Ratings bạn nhé. Bạn xem hướng dẫn sử dụng trong bài viết này: https://wpcanban.com/wordpress/thu-thuat-wordpress/huong-dan-cai-dat-va-su-dung-plugin-kk-star-ratings.html