Facebook mất 3.700 USD/giây trong sự cố lịch sử kéo dài 7 tiếng vừa qua
Trung bình mỗi giây Facebook gặp sự cố không thể truy cập được, mạng xã hội này đã bị mất 3.700 USD doanh thu.
Sự cố khiến Facebook cùng hàng loạt dịch vụ của hãng như Messenger, Instagram, WhatsApp bị “sập” vào tối 4/10 (theo giờ Việt Nam) được xem là sự cố nghiêm trọng nhất trong lịch sử của mạng xã hội này.
Sự cố này không chỉ làm ảnh hưởng nghiêm trọng đến hàng tỷ người dùng trên toàn cầu, mà còn làm thiệt hại không nhỏ đến doanh thu của Facebook.
Tạp chí Fortune và Snopes (trang web chuyên kiểm tra tính xác thực của thông tin) đã ước tính rằng trong hơn 7 giờ gặp sự cố, Facebook đã thiệt hại ít nhất 60 triệu USD doanh thu đến từ quảng cáo trên các ứng dụng và dịch vụ của hãng. Con số thiệt hại về doanh thu này thậm chí có thể lên đến hơn 100 triệu USD.
Facebook đã thiệt hại một khoảng doanh thu không hề nhỏ sau sự cố kéo dài trong đêm 4/10
Mức thiệt hại này được Fortune và Snopes ước tính dựa trên báo cáo doanh thu trong quý II/2021 của Facebook. Theo đó, trong 3 tháng của quý II/2021, Facebook đã đạt được doanh thu 29 tỷ USD, tương đương với mức doanh thu 319,6 triệu USD/ngày; 13,3 triệu USD/giờ, khoảng 220.000 USD/phút và mức doanh thu 3.700 USD/giây. Từ đó, Fortune và Snopes đã tính toán ra mức thiệt hại mà Facebook phải chịu trong hơn 7 giờ toàn bộ các dịch vụ của mạng xã hội này gặp sự cố.
Không chỉ chịu thiệt hại về doanh thu quảng cáo khi các dịch vụ ngưng hoạt động, sự cố kéo dài này còn khiến giá cổ phiếu của Facebook giảm mạnh, mất gần 5% giá trị. Điều này đã khiến cho khối tài sản của nhà sáng lập Mark Zuckerberg “bốc hơi” gần 7 tỷ USD chỉ sau một đêm. Hiện tại giá cổ phiếu của Facebook đã được phục hồi sau khi sự cố được khắc phục và các dịch vụ của hãng quay trở lại hoạt động bình thường.
Facebook công bố nguyên nhân gây ra sự cố trên toàn cầu
Ngay sau khi sự cố xảy ra trên phạm vi toàn cầu, các chuyên gia công nghệ nhận định rằng nguyên nhân dẫn đến sự cố này là một lỗi thiết lập nào đó liên quan đến hệ thống phân giải tên miền (DNS) và Border Gateway Protocol (BGP), một giao thức quan trọng trên mạng Internet. Chính những thiết lập sai đã khiến cho Facebook “biến mất” hoàn toàn khỏi mạng Internet.
Mới đây, đại diện Facebook đã chính thức lên tiếng giải thích về nguyên nhân gây ra sự cố, cho thấy rằng nhận định của các chuyên gia công nghệ là hoàn toàn chính xác.
Video đang HOT
“Các nhóm kỹ sư của chúng tôi đã phát hiện ra rằng những thay đổi cấu hình trên các router backbone (router chính) điều phối lưu lượng mạng giữa các trung tâm dữ liệu của chúng tôi đã gây ra sự cố làm gián đoạn giao tiếp”, đại diện Facebook cho biết. “Chúng tôi tin rằng nguyên nhân gốc rễ của sự cố ngừng hoạt động này là do lỗi trong thay đổi cấu hình. Chúng tôi cũng không có bằng chứng cho thấy dữ liệu người dùng bị xâm phạm do sự cố ngừng hoạt động này”.
Đại diện Facebook cũng chia sẻ nguyên do quá trình khắc phục lỗi diễn ra chậm trễ và vì sự cố cũng đã ảnh hưởng đến hệ thống mạng nội bộ của Facebook, nên các kỹ sư của hãng phải mất nhiều thời gian hơn để tiếp cận và xử lý vấn đề. Facebook cũng đưa ra lời xin lỗi đến người dùng vì sự cố xảy ra.
“Chúng tôi xin lỗi tất cả những người bị ảnh hưởng và chúng tôi vẫn đang nỗ lực làm việc để hiểu thêm về những gì vừa xảy ra để chúng tôi có thể tiếp tục cải thiện cơ sở hạ tầng của mình tốt hơn”, đại diện Facebook cho biết thêm.
Việc hàng loạt các dịch vụ của Facebook gặp sự cố, làm ảnh hưởng đến hàng tỷ người dùng trên toàn cầu cho thấy tầm ảnh hưởng hết sức to lớn của mạng xã hội này cũng như các dịch vụ của nó đến cuộc sống hàng ngày của người dùng Internet.
Lỗi BGP là gì mà khiến Facebook, Instagram sập toàn cầu?
Sai sót trong cấu hình router là nguyên nhân khiến hàng loạt dịch vụ của Facebook gặp sự cố, tuy nhiên các yếu tố kỹ thuật chi tiết chưa được chia sẻ.
Tối ngày 4/10 (giờ Việt Nam), các dịch vụ của Facebook gồm nền tảng chính, Instagram, Messenger và WhatsApp bất ngờ không thể truy cập. Sự cố diễn ra trong khoảng 8 tiếng, đến khoảng 7h sáng 5/10, đa số dịch vụ của Facebook đã hoạt động bình thường trở lại.
Sáng cùng ngày, Facebook cho biết nguyên nhân sự cố đến từ sai sót trong lúc tinh chỉnh router điều phối lưu lượng mạng giữa các trung tâm dữ liệu. Các chi tiết kỹ thuật chưa được công bố. Sau khi phân tích, các chuyên gia an ninh mạng từ Cloudflare cho rằng sự cố có thể liên quan đến giao thức định tuyến Internet có tên BGP.
Hàng loạt dịch vụ của Facebook gặp lỗi vào tối 4/10.
BGP như một "bản đồ trên Internet"
Viết tắt của Border Gateway Protocol, BGP về cơ bản là một trong những hệ thống định tuyến lưu lượng, đưa thiết bị của người dùng đến website cần truy cập càng nhanh càng tốt.
Do có nhiều nhà cung cấp dịch vụ Internet, router và máy chủ, có nhiều "con đường" khác nhau để truyền lưu lượng đến địa chỉ đích. Nhiệm vụ của BGP là tìm kiếm, lựa chọn "con đường" tốt nhất để truy cập vào website cần đến.
Trang The Verge mô tả BGP như người cập nhật "tuyến đường" để vẽ bản đồ, hướng dẫn máy tính truy cập các website như YouTube hay Facebook. Tuy nhiên, giữa các website luôn có nhiều điểm đến như máy chủ nhà mạng, dịch vụ trung gian... BGP sẽ chỉ ra những nơi lưu lượng cần đi qua để đến website đích.
Do Internet luôn thay đổi, bản đồ cần được cập nhật để tránh dẫn nhầm đường. Các hệ thống thường "tham khảo" thông tin từ máy chủ khác để sao chép thông tin mới. Nếu một điểm đến gặp lỗi nhưng không được phát hiện, chúng sẽ ảnh hưởng đến bản đồ, khiến lưu lượng không được truyền đến đúng vị trí.
BGP đóng vai trò quan trọng giúp máy tính điều hướng đến website đích.
Ví dụ, người dùng cần đến website A, máy chủ website này sử dụng nhà cung cấp mạng B, nhưng máy tính của bạn dùng nhà mạng C. Trong trường hợp này, B và C không thể liên lạc trực tiếp, nhưng nhà mạng C có thể liên lạc với trung gian D, D sau đó liên lạc với E, E có thể liên lạc đến A. Nếu đó là con đường duy nhất, BGP sẽ chọn nó để đưa người dùng đến website A. Nếu cả nhà mạng B và C cùng kết nối đến máy chủ dịch vụ F, BGP sẽ chọn con đường này để tránh đi qua các bên trung gian mà vẫn kết nối người dùng bình thường.
Tuy nhiên, không phải lúc nào tuyến đường ngắn nhất cũng tốt nhất. Có nhiều nguyên nhân BGP chọn con đường dài hơn như chi phí, hoặc chứa máy chủ được yêu cầu truy cập từ trước
Chuyện gì đã xảy ra với Facebook?
Đối với Facebook, công ty này xây dựng hệ thống BGP riêng. Trong thông báo ngày 5/10, Facebook cho biết sự cố xảy ra do "thay đổi cấu hình trên router điều phối lưu lượng mạng giữa các trung tâm dữ liệu... Điều đó ảnh hưởng đến cách giao tiếp của các trung tâm dữ liệu, khiến các dịch vụ ngừng hoạt động".
Dựa trên thông báo, The Verge cho rằng sự cố có thể xảy ra từ nội bộ Facebook. Tuy nhiên, lỗi này ảnh hưởng đến hàng triệu người dùng trên thế giới. Các chuyên gia nhận định Facebook "bị xóa sổ khỏi Internet" khi điểm đến trên bản đồ biến mất.
Thông báo lỗi trên Facebook vào tối 4/10.
Nhiều lập trình viên đã so sánh BGP với DNS (Domain Name System). Theo mô tả của Cloudflare, DNS là địa chỉ IP của website đích, còn BGP là tuyến đường để đi đến nơi đó.
Từng có 2 sự cố trên quy mô lớn ảnh hưởng đến hoạt động của BGP, bao gồm một ISP của Thổ Nhĩ Kỳ vô tình yêu cầu toàn bộ Internet định tuyến lưu lượng đến server của dịch vụ này vào năm 2004. Đến năm 2008, một ISP tại Pakistan vô tình chặn YouTube trên toàn thế giới. Do các hệ thống BGP thường tham khảo lẫn nhau, toàn bộ người dùng Internet đã bị ảnh hưởng.
Các chuyên gia mạng máy tính ví sự cố khiến Facebook "bị xóa sạch khỏi Internet".
Bên cạnh chính phủ, một tổ chức lớn cũng có thể vô tình ảnh hưởng đến BGP.
Năm 2018, hacker đã chiếm đoạt lưu lượng truy cập đến Amazon trong gần 2 tiếng, đánh cắp hàng nghìn USD tiền mã hóa Ethereum bằng cách xâm nhập hệ thống BGP của một ISP kết nối với Amazon. Từ đó, lưu lượng truy cập đến Amazon đã bị chuyển hướng đến địa chỉ khác.
Sai sót trong cập nhật BGP cũng có thể ảnh hưởng đến tuyến đường lưu lượng. Đại diện của Cloudflare cho biết đã ghi nhận nhiều bản cập nhật BGP từ Facebook ngay trước khi sự cố xảy ra. Một trong những lãnh đão của Fastly cho biết Facebook đã ngừng cấp tuyến đường lưu lượng đến dịch vụ này.
Ngay cả các website nội bộ của Facebook cũng không thể truy cập. Theo The Verge , một số kỹ sư đã đến trung tâm dữ liệu của Facebook tại California (Mỹ) để khắc phục sự cố.
Sự cố diện rộng của Facebook diễn ra trong nhiều giờ liên tục. Với quy mô lớn và lưu lượng truy cập đông, Facebook cần đảm bảo không xảy ra sai sót khi cập nhật hoặc tùy chỉnh máy chủ, đảm bảo điểm đến không bị xóa khỏi bản đồ để BGP điều hướng lưu lượng chính xác.
Facebook gặp lỗi truy cập ảnh tại Việt Nam Sáng 2/6, người dùng Facebook tại Việt Nam cho biết không thể truy cập ảnh đối với các bài đăng sử dụng nhiều ảnh cùng lúc. Nhiều người dùng phản ánh Facebook bị lỗi truy cập ảnh tại Việt Nam. Sáng nay 2/6, nhiều người dùng Facebook tại Việt Nam cho biết mạng xã hội này đang gặp lỗi khi truy cập ảnh....