FacebookExternalHit
Mục đích chính của FacebookExternalHit là thu thập nội dung của ứng dụng/trang web được chia sẻ trên một trong các nhóm ứng dụng của Meta, chẳng hạn như Facebook, Instagram hoặc Messenger. Liên kết có thể đã được chia sẻ bằng cách sao chép và dán hoặc thông qua plugin xã hội của Facebook. Trình thu thập dữ liệu này thu thập, lưu vào bộ nhớ đệm và hiển thị thông tin về ứng dụng/trang web nêu trên, chẳng hạn như tiêu đề, nội dung mô tả và hình thu nhỏ.
Chuỗi UA cụ thể mà bạn thấy trong file nhật ký sẽ tương tự như một trong những chuỗi sau đây:
- facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)
- facebookexternalhit/1.1
- facebookcatalog/1.0
Lưu ý rằng trình thu thập dữ liệu FacebookExternalHit có thể bỏ qua file robots.txt khi kiểm tra bảo mật hoặc kiểm tra tính toàn vẹn, chẳng hạn như kiểm tra phần mềm hay nội dung độc hại.
-> Xóa bỏ FacebookExternalHit gây bardwith cao trong myphpdata
Cách chặn facebookexternalhit/1.1 Crawler
Để chặn trình thu thập thông tin facebookexternalhit , bạn có thể sử dụng nhiều phương pháp khác nhau, bao gồm:
- Tệp .htaccess : Bạn có thể thêm đoạn mã sau vào cuối tệp .htaccess của máy chủ web Apache để chặn trình thu thập dữ liệu facebookexternalhit . Lưu ý, điều này sẽ chặn tất cả các yêu cầu từ Facebookexternalhit/1.1 :
# BLOCK Facebook Crawler RewriteEngine On RewriteCond %{HTTP_USER_AGENT} ^facebookexternalhit/1\.1 [NC] RewriteRule ^ - [F,L] # BLOCK Facebook Crawler END
- Chặn IP : Bạn có thể chặn địa chỉ IP của Facebook bằng tường lửa của máy chủ hoặc phần mềm chặn IP. Tuy nhiên, phương pháp này không được khuyến khích vì địa chỉ IP của Facebook liên tục thay đổi.
- Chặn tác nhân người dùng : Bạn có thể chặn facebookexternalhit bằng cách sử dụng plugin hoặc phần mềm chặn tác nhân người dùng, chẳng hạn như chỉ thị SetEnvIf của Apache .
- Cloudflare : Nếu bạn đang sử dụng Cloudflare, bạn có thể chặn facebookexternalhit bằng các quy tắc tường lửa của Cloudflare.
Bài viết khác cùng Box :