Thủ thuật chống Backlink xấu

Chặn backlink bằng file .htaccess
Hôm trước vào blog của anh Babywolf thấy có bài nói về chủ đề này. Thấy rất hữu ích nên mình viết lại ở đây. Trên các diễn đàn thì họ đang thảo luận chặn backlink xấu bằng phương pháp sử dụng HTTP Referer , tuy nhiên theo anh Babywolf phân tích thì cách này không hiệu quả vì không thể chặn Google Bot.
Anh đưa ra một cách giải thích rất dễ hiểu : “Một con Googlebot thứ nhất (gọi tắt là Googlebot #1) Crawl trang A và thu thập nội dung của trang A, đồng thời thu thập tất cả các URL liên kết có trong trang A, sau đó Googlebot #1 này đem dữ kiện báo cáo về trung tâm lưu trữ. Các URL liên kết được đưa tập hợp vào một danh sách và sắp xếp thứ tự ưu tiên để phân công nhiệm vụ cho các Googlebot khác tiếp tục đi Crawl và Index các danh sách URL đó”
Như vậy, các con bot khác khi được phân công nhiệm vụ thì nó sẽ là dạng request trực tiếp chứ không phải như hành động click chuột của một người dùng thông thường từ trang A đến trang B. Do đó, lúc này thông số HTTP Referer không được sinh ra đồng thời có thể kết luận là việc chặn liên kết từ trang khác bằng HTTP Referer đối với Googlebot là không hiệu quả.
Mặt khác, cho dù đặt giả thuyết là Googlebot sẽ có hành vì giống như người là nó sẽ di chuyển từ trang này đến trang khác thông qua URL thì cách trên vẫn không hiệu quả. Bởi vì lúc này bot sẽ nhận được trạng thái Forbidden (không cho phép truy cập). Và như vậy thì bot cũng sẽ dễ bị hiểu nhầm rằng trang này không cho phép truy cập, điều này có khi sẽ mang lại tai hại cho bạn nếu như bot cập nhật thông tin Forbidden này và con mang lại tác dụng ngược cho website của bạn.
Thủ thuật chống backlink xấu chủ yếu dựa vào file .htaccess
Phương pháp này dựa trên nguyên lý bắt HTTP Referer header để chặn các backlink không mong muốn.
Chúng ta có 1 đoạn code như sau đặt trong file .htaccess:
SetEnvIfNoCase Referer “.*(cụm từ chứa trong domain).*” ban
SetEnvIfNoCase Referer “.*(googlepanda).*” ban
order allow,deny
deny from env=ban
allow from all
Với nôi dung trong ( ) là cụm từ chứa trong domain mà bạn muốn chặc liên kết trỏ đến website của bạn.
Ví dụ : http://googlepanda.blogspot.com
Nếu bạn set giá trị
SetEnvIfNoCase Referer “.*(googlepanda).*” ban
Thì kết quả là tất cả những liên kết xuất phát từ http://googlepanda.blogspot.com sẽ không thể kết nối đến site của bạn và lúc này trình duyệt sẽ hiển thị lỗi “403 Forbiden – You don’t have permission to access / on this server”
Mặc khác nếu bạn set giá trị
SetEnvIfNoCase Referer “.*(blogspot).*” ban
Thì kết quả những trang co domain chứa blogspot bao gồm cả google panda.blogspot.com sẽ đều bị chặn khi liên kết đến trang của bạn .
Hãy kiểm tra lượng backlink trỏ đến web của bạn hằng ngày bằng các công cụ hỗ trợ như open site explorer, backlink watch, raventools, webseoanalytics, ontolo… Để kiểm tra những domain có dấu hiệu bất thường và tiến hành ngăn chặn kịp thời. Có thể đây chỉ là 1 giải pháp tình thế nhằm hạn chế phần nào ảnh hưởng của những liên kết xấu. Mong rằng nó cũng sẽ giúp chiến dịch SEO của bạn hiệu quả hơn.
Vì một cộng đồng seo vững mạnh. Rất mong nhận được nhiều giải pháp và nhận xét từ mọi người để có thể khắc phục một cách triệt để hơn.
Bài viết được biên tập và chỉnh sửa từ bài viết của anh Babywolf
Cảm ơn anh về tư liệu của bài viết.




