Công ty gần như vô danh này vừa làm gián đoạn cả mạng lưới Internet toàn cầu
Có thể bạn chưa nghe nói về Fastly, nhưng nhiều người đã cảm nhận được phần nào tác động của nó khi các trang web trên khắp thế giới đồng thời gặp sự cố vào hôm qua.
Vào sáng thứ Ba (8/6), lúc khoảng 10h50 sáng theo giờ BST và 5h50 sáng theo giờ ET, một loạt các trang web đình đám đã không thể truy cập trong khoảng một giờ. Chúng bao gồm Reddit, Amazon, Twitch, CNN, The New York Times, BBC, PayPal, HBO Max, Hulu, PayPal, và thậm chí cả trang web của chính phủ Vương quốc Anh.
Tất cả chúng chỉ có một điểm chung duy nhất là sử dụng dịch vụ của Fastly, một nhà cung cấp mạng phân phối nội dung (CDN).
Có thể bạn chưa nghe nói về Fastly, nhưng bạn có thể đã và đang tương tác với nó theo một cách nào đó mỗi khi lên mạng. Cùng với Cloudflare và Akamai, chúng là ba nhà cung cấp CDN lớn nhất trên thế giới. Và trong khi chính Fastly vẫn đang mơ hồ về sự cố nào đã gây ra tình hình gián đoạn trên toàn thế giới, thì sự việc cũng đưa ra một lời nhắc nhở rõ ràng về việc cơ sở hạ tầng internet của chúng ta được kết nối với nhau và mong manh như thế nào, đặc biệt là khi phần lớn nó phụ thuộc vào quy trình hoạt động của một số công ty vẫn đang nằm ngoài nhận thức của cộng đồng.
Món “hàng” đặc biệt
Để hiểu một cách đơn giảm về vai trò và tầm quan trọng của Fastly, hãy cùng dành một phút tìm hiểu về vai trò của CDN trong hệ sinh thái Internet. Mặc dù nhiều người vẫn coi Internet là vô định hình, nhưng các bài báo mà bạn đọc, phim và bài hát bạn đang phát trực tuyến, ảnh bạn đăng, tất cả chúng đều nằm trên các máy chủ vật lý. Và mặc dù nội dung đó có thể chủ yếu được lưu trữ trên một nhà cung cấp dịch vụ đám mây, nhưng vẫn cần một cách để đưa nó đến với mọi người một cách nhanh chóng và hiệu quả.
Đó là nơi CDN xuất hiện. Bằng cách vận hành các máy chủ trên toàn cầu, CDN có thể thu hẹp khoảng cách giữa điện thoại thông minh của bạn và trải nghiệm Internet mà bạn lựa chọn. Hãy coi nó giống như việc một quả bóng di chuyển ra sao trong môn bóng chày: Thay vì cố gắng ném quả bóng về sân nhà của chính mình, một cầu thủ sẽ ném nó cho một đồng đội và người này sẽ ném nó cho người bắt bóng. Việc này nhanh hơn và hiệu quả hơn ném thẳng quả bóng về sâu nhà.
“Về cơ bản, CDN mang lại hiệu suất thực sự cao cho nội dung, cho dù đó là video phát trực tuyến hoặc một trang web, hoặc tất cả những hình ảnh nhỏ xuất hiện khi bạn truy cập vào một trang thương mại điện tử”, Angelique Medina, giám đốc tiếp thị sản phẩm của công ty giám sát mạng ThousandEyes cho biết. “Nó cho phép người dùng giảm bớt rất nhiều thời gian tải trang và cũng cho phép mọi người có trải nghiệm thực sự tuyệt vời khi họ đang lướt web.”
Lấy ví dụ như bài báo mà bạn đang đọc này, ngay bây giờ. Rất có thể thứ bạn đang đọc một bản sao của nó, được lưu trong bộ nhớ cache của thứ được gọi là “điểm hiện diện” (POP), hay một máy chủ ở đâu đó trong khu vực bạn đang sống. Bản đồ mạng lưới Fastly chỉ ra rằng công ty này vận hành POP ở ít nhất 58 thành phố trên khắp thế giới, bao gồm nhiều thành phố ở các khu vực đông dân cư như Los Angeles, London và Singapore. Nó liệt kê công suất toàn cầu kết hợp ở mức khổng lồ là 130 terabits mỗi giây.
Danh sách các ông lớn bị ảnh hưởng bởi sự cố Fastly.
Và đó không phải là tất cả! CDN không chỉ lưu trữ nội dung gần hơn với các thiết bị mong muốn nó. Công ty này cũng giúp định hướng chúng trên internet.
“Nó giống như điều phối luồng giao thông trên một hệ thống đường lớn” , Ramesh Sitaraman, một nhà khoa học máy tính tại Đại học Massachusetts ở Amherst, người đã giúp tạo ra CDN lớn đầu tiên với tư cách là một kiến trúc sư nguyên tắc tại công ty Akamai cho biết. “Nếu một số liên kết trên internet bị lỗi hoặc bị tắc nghẽn, các thuật toán CDN sẽ nhanh chóng tìm ra một tuyến đường thay thế đến đích”.
Video đang HOT
Vì vậy, khi một CDN gặp sự cố, nó có thể kéo theo nhiều phần của Internet đi cùng.
Độc quyền CDN
“Chúng tôi đã xác định cấu hình dịch vụ gây ra gián đoạn trên các POP của chúng tôi trên toàn cầu và đã vô hiệu hóa cấu hình đó” , người phát ngôn của Fastly cho biết trong một tuyên bố. “Mạng toàn cầu của chúng tôi sẽ trực tuyến trở lại.”
Một lần nữa, không rõ chính xác điều gì đã xảy ra tại Fastly. Khái niệm “cấu hình dịch vụ” có thể có nghĩa là bất kỳ thứ gì, nhưng có một điều chắc chắn duy nhất là bất kể nguyên nhân gốc rễ ra sao thì nó đều có tác động trên phạm vi rộng. Theo trang báo cáo sự cố của Fastly, mọi lục địa trên toàn cầu, ngoài Nam Cực, đều cảm nhận thấy tác động của sự cố.
Và ngay cả sau khi Fastly đã khắc phục sự cố về cơ bản, công ty cũng cảnh báo rằng người dùng vẫn có thể thấy “tỷ lệ truy cập bộ nhớ cache” thấp hơn – tần suất bạn có thể tìm thấy nội dung mình cần đã được lưu trữ trong một máy chủ lân cận – và “tải gốc tăng lên”, khái niệm đề cập tới quá trình quay trở lại nguồn đối với các mục không có trong bộ nhớ cache.
Các CDN về cơ bản thường được thiết kế để chống lại các điều kiện khắc nghiệt và sự cố không mong muốn. Nếu một máy chủ bị lỗi, các máy chủ khác có thể tiếp nhận tải. Nếu toàn bộ trung tâm dữ liệu bị lỗi, áp lực truyền tải có thể được chuyển sang các trung tâm dữ liệu khác. Nếu mọi thứ hoạt động hoàn hảo, thì khi sự cố xảy ra, các cơ chế phục hồi của CDN sẽ đảm bảo rằng người dùng gần như không bao giờ nhận ra điều gì bất thường.
Nhưng khi có gì đó xảy ra, nó thường liên quan đến lỗi phần mềm hoặc lỗi cấu hình được đẩy đến nhiều máy chủ cùng một lúc, theo Sitaraman.
Ngay cả khi đó, các trang web và dịch vụ sử dụng CDN thường có các biện pháp dự phòng của riêng mình. Ví dụ như gã khổng lồ Amazon, chỉ mất khoảng 20 phút để thiết lập và chạy trở lại, vì nó có thể chuyển hướng lưu lượng truy cập sang các nhà cung cấp CDN khác. Nhưng với những người chỉ dựa vào Fastly hoặc không có hệ thống tự động để xử lý sự cố, họ đều phải chờ đợi.
Khi một CDN gặp sự cố, ảnh hưởng sẽ vô cùng rộng khắp.
Roland Dobbins, kỹ sư chính của công ty bảo mật Netscout cho biết: “Việc ngừng hoạt động là kết quả của việc độc quyền”. Ông gợi ý rằng mọi tổ chức có sự hiện diện trực tuyến đáng kể trên Internet nên có nhiều nhà cung cấp CDN để tránh loại tình huống này.
Tuy nhiên, các lựa chọn của họ ngày càng bị hạn chế. Bởi cũng giống như việc các hệ thống dữ liệu đám mây phần lớn đã nằm trong tay Amazon, Google và Microsoft, thì ba nhà cung cấp CDN là Cloudflare, Akamai và Fastly đã thống trị luồng nội dung trực tuyến.
“Có rất nhiều người tập trung sử dụng dịch vụ của rất ít nhà cung cấp dịch vụ”, Medina nói. “Bất cứ khi nào một trong ba nhà cung cấp đó gặp sự cố, thường đó sẽ không phải là sự cố tồn tại trong thời gian dài, nhưng nó sẽ có tác động lớn trên Internet.”
Và theo bà Medina, theo thời gian khi có thêm ngày càng nhiều người phải dựa vào số ít các công ty này, thì khi vấn đề xảy ra, càng nhiều kết nối bị bỏ lỡ và sự cố sẽ càng lớn.
Nhiều website nổi tiếng đồng loạt 'sập'
Chiều 8/6 giờ Việt Nam, nhiều website nổi tiếng trên thế giới gặp hiện tượng không thể truy cập. Đây có thể là sự cố Internet lớn nhất từ trước đến nay đối với các nền tảng này.
Theo dữ liệu từ Downdetector , đây là sự cố diện rộng và con số các website không thể truy cập đang không thể thống kê hết. Ngoài các trang báo quốc tế, ngay cả Amazon, Twitch, Reddit, Paypal, Hulu cũng gặp vấn đề tương tự. Lượng báo lỗi tăng vọt từ khoảng 16h30 (giờ Việt Nam).
Sự cố tồi tệ của các nền tảng Internet
Hàng loạt báo quốc tế đang không thể truy cập vì lỗi hạ tầng của Amazon Web Services. Ảnh: Twitter.
Hàng loạt báo quốc tế đang không thể truy cập vì lỗi hạ tầng của Amazon Web Services. Ảnh: Twitter.
Đa số website khi truy cập sẽ hiện thông báo "Error 503 Service Unavailable". Lỗi này xảy ra khi máy chủ website tạm thời không thể xử lý yêu cầu truy cập, có thể do quá tải, gặp lỗi hoặc đang được bảo trì. Trong tình trạng này, dường như nhà cung cấp máy chủ cho các website đang gặp lỗi nghiêm trọng.
Thông kê từ Downdetector cho thấy nhiều nền tảng lớn đang "sập".
Thông kê từ Downdetector cho thấy nhiều nền tảng lớn đang "sập".
Theo Tom Warren, biên tập viên trang công nghệ The Verge, đây là sự cố về mạng lớn nhất từ trước tới nay của các trang báo. Trên tài khoản Twitter, The Verge cho biết vì chính trang web của họ cũng đang sập, họ sẽ cập nhật tin tức qua Google Docs. Biện pháp này ngay lập tức trở thành trò đùa, bởi biên tập viên của The Verge đã quên tắt tính năng cho phép chỉnh sửa.
Nguyên nhân đến từ mạng lưới CDN của Fastly
Theo Engadget , nguồn gốc sự cố có thể đến từ Fastly. Đây là nền tảng phân phối nội dung (CDN) dựa trên nền tảng đám mây, được sử dụng phổ biến bởi nhiều trang web tại Mỹ. Trên trang cập nhật trạng thái, Fastly cho biết đang điều tra nguyên nhân xảy ra sự cố.
Đến 17h38 giờ Việt Nam, Reddit và Amazon đã hoạt động trở lại. Các trang như CNN, New York Times vẫn báo lỗi "I/O error" hoặc "Error 503 Service Unavailable". Sau khi trở lại 5 phút, trang Reddit tiếp tục sập.
Chuyên trang công nghệ The Verge lập tức đùa cợt sự cố bằng việc "cập nhật" tin tức qua Google Docs.
Chuyên trang công nghệ The Verge lập tức đùa cợt sự cố bằng việc "cập nhật" tin tức qua Google Docs.
Đến 18h, các website như Reddit, Twitch, CNN đã truy cập bình thường. Lượng báo cáo lỗi cũng giảm dần trên DownDetector.
Fastly cung cấp mạng phân phối nội dung (CDN), là một phần quan trọng của cơ sở hạ tầng Internet. CDN chịu trách nhiệm điều hành mạng lưới máy chủ rải khắp toàn cầu để cải thiện hiệu suất và tính khả dụng của các dịch vụ web.
Cụ thể, CDN hoạt động như một "bộ nhớ đệm" lớn, dữ liệu người dùng muốn tiếp cận sẽ được phân phối đến máy chủ gần họ nhất, từ đó rút ngắn thời gian truy cập. CDN gặp lỗi khiến các máy chủ không thể hoạt động hiệu quả, nội dung người dùng cần tải ở quá xa khiến mất thời gian truy cập.
Chẳng hạn, khi người dùng muốn xem một bài báo của Bloomberg đang được lưu trữ ở Mỹ, thông tin ấy sẽ được gửi vượt đại dương, tiêu tốn hàng chục giây để đến nơi. Nhưng với CDN, bài báo sẽ được tải sẵn đến máy chủ gần nhất với người dùng. Khi cần truy cập, thông tin đó sẽ đến đích nhanh hơn.
Tháng 8/2020, sự cố của nhà mạng CenturyLink khiến nhiều hệ thống như Cloudflare, Hulu, PlayStation Network, Xbox Live... đồng loạt ngừng hoạt động. Do cũng cung cấp CDN tương tự Fastly, việc Cloudflare gặp lỗi kéo theo hàng loạt website khác không thể truy cập.
Hiểm họa Internet mới đang âm thầm diễn ra Ngày càng nhiều tổ chức, cá nhân dùng VPN và những mạng riêng ảo này kém bảo mật sẽ dẫn đến hậu quả nghiêm trọng. Vụ hack SolarWinds gây rúng động nước Mỹ là ví dụ rõ nhất. Ẩn sau các vụ hack "bom tấn" gần đây là một mối đe dọa tồn tại nhiều năm nay nhưng ít được chú ý đến....