Lưu trữ dữ liệu: Ngày ấy và bây giờ

Theo dõi VGT trên

Kích thước ổ đĩa lưu trữ càng nhỏ, dung lượng lưu trữ càng tăng…- đó chính là sự thay đổi lớn nhất trong 6 thập kỉ qua.

Theo IDC, năm nay số lượng dữ liệu sẽ tăng 2.16 zettabyte trên toàn thế giới (1 zettabyte tương đương hơn 1 tỉ TB). Đến năm 2016, con số này sẽ là 3,77 zettabyte. Thiết bị lưu trữ và công nghệ bán dẫn là hai lĩnh vực phát triển nhanh nhất. Tính theo chu kì từ 12 đến 18 tháng, các ổ HDD,SSD…sẽ có dung lượng tăng gấp đôi.

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 1

Trong khi đó, ổ đĩa máy tính để bàn hiện nay có dung lượng càng lớn: 4 TB (cuối năm nay sẽ là 5 TB) đủ để giữ 1 triệu hình ảnh hoặc 562 giờ video HD. Đến năm 2020 Seagate cho biết, họ sẽ cho ra mắt ổ cứng máy tính 60 TB, đủ lưu trữ 12 triệu hình ảnh hoặc 6750 giờ video HD.

Đó chính là xu hướng phát triển của các thiết bị lưu trữ, tương lai là thế còn quá khứ như thế nào? Ở bài viết này, chúng tôi xin điểm lại và so sánh các thiết bị lưu trữ xưa và nay.

Thẻ nhớ microSD từ 128 MB cho đến đến 128 GB

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 2

Với khả năng lưu trữ ngày càng tăng (tỉ lệ tăng trưởng đạt 175 % mỗi năm), bộ nhớ flash NAND vẫn còn “trẻ trung” và đang “lớn dần”…Vào năm 1987, Toshiba đã công bố NAND đầu tiên. Năm 1995, công ty giới thiệu một thẻ nhớ 40 MB cho máy ảnh. Gần 20 năm sau, thẻ nhớ microSD nhỏ chưa bằng một móng tay với dung lượng 128 MB đã ra đời, có thể lưu trữ hơn 100 tỉ byte dữ liệu. Và mới đây, SanDisk giới thiệu thẻ nhớ microSD dung lượng 128 GB. Có nhiều bạn tự hỏi rằng với 128 GB lưu trữ được những gì? Đó là khoảng 32.000 bài hát, 27 phim DVD và lên đến 250.000 bức ảnh. Và trong thời gian tới, bộ nhớ flash NAND vẫn còn tiếp tục phát triển và 3D NAND hứa hẹn sẽ là giải pháp tốt trong tương lai.

Dung lượng HDD tăng 1 triệu lần

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 3

Năm 1956, IBM giới thiệu ổ HDD đầu tiên mang tên RAMAC 350 (Random Access Method of Accounting and Control). RAMAC 350 có “ngoại hình” và kích thước “hầm hố”, nặng khoảng một tấn. Nó có dung lượng 5 MB, chỉ “cất giữ” được một bài hát MP3, với chi phí khoảng 1000 USD cho mỗi megabyte.

Hôm nay, các HDD có kích thước chỉ 3,5 inch, dung lượng lưu trữ 4 TB (5 TB vào cuối năm nay), có thể lưu đến 760.000 bài hát. Ngoài ra, ổ đĩa trung tâm dữ liệu của WD, chứa đầy khí heli có dung lượng lên đến 6 TB. Bạn nghĩ rằng thế đã là rất lớn? Đến năm 2020, Seagate hi vọng một công nghệ gọi là HAMR cho phép tăng dung lượng HDD lên đến 10 lần. Có nghĩa rằng, ổ HDD trong tương lai có dung lượng 60 TB, đủ chứa 15 triệu bài hát hoặc 6750 giờ video HD.

Giải pháp lưu trữ cho doanh nghiệp

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 4

EMC Symmetrix đóng vai trò là máy chủ ảo đầu tiên trong giải pháp xây dựng dữ liệu cho công ty, tổ chức. Bên trái là EMC Symmetrix 1 có dung lượng 2 GB, bên phải EMC Symmetrix VMAX (thế hệ thứ 10) có dung lượng 2 petabyte, gấp 1 triệu lần so với thế hệ đầu tiên.

Tốc độ ngày càng lớn

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 5

Ở phía trên là Dysan Disk Pack ra đời vào những năm 70 với dung lượng 200 MB, “tấm đĩa’ này có kích thước 14 inch, nặng khoảng 0,5 kg. Disk Pack có thể lắp vào ổ đĩa cứng IBM 1311, mỗi đĩa có 20 sector (vùng vật lý), mỗi sector có dung lượng 100 kí tự và chuyển dữ liệu ở 50 Kbps. Ở phía dưới là một ổ đĩa flash Toshiba 512 GB NAND chuẩn PCIe mà bạn có thể tìm thấy trong một thiết bị di động, nó có thể đạt băng thông 2 Gbps với 4x PCIe 2.0.

Kích thước ngày càng nhỏ hơn

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 6

Bên trái là ổ đĩa RA80 xuất hiện vào những năm 80, là một trong những thiết bị lưu trữ đầu tiên sử dụng ổ đĩa platter (ổ đĩa từ), kích thước 14 inch, dung lượng 124 MB, bao gồm 30 sector, mỗi sector có khả năng lưu trữ 412 byte dữ liệu. Bên phải là ổ Microdrive 5 GB từ Seagate, thực ra các ổ Microdrive ra mắt vào năm 1999 bởi IBM có kích thước 1,8 inch., 1 inch và 0,85 inch, được sử dụng trong các máy nghe nhạc MP3, chẳng hạn như máy nghe nhạc iPod. Microdrive là ví dụ điển hình nhất về công nghệ ổ cứng cho phép “nhồi nhét” dung lượng lớn vào một kích thước nhỏ. Ngày nay, bạn dễ dàng thấy những ổ cứng máy tính dung lượng 2 TB với kích thước 2.5 inch (trung bình 760 GB/mỗi inch).

SSD ngày càng rẻ

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 7

Một vài năm trước ổ cứng trạng thái rắn (SSD) rất đắt đỏ, đó là lí do tại sao nó không được quan tâm tới việc thay thế cho ổ cứng cơ học, mặc dù SSD nổi trội hơn nhiều so với HDD truyền thống xét về thời gian khởi động, truy cập dữ liệu, tốc độ đọc và ghi…Ngày nay, với công nghệ phát triển với tốc độ chóng mặt, các ổ SSD có xu hướng ngày càng rẻ, bên cạnh đó các SSD trong tương lai sẽ có công suất cao gấp nhiều lần so với hiện tại.

Lưu trữ dạng băng từ sẽ bị “khai tử”?

Lưu trữ dữ liệu: Ngày ấy và bây giờ - Hình 8

Lưu trữ dạng băng từ (Tape) xuất hiện đầu những năm 50, hồi chuông báo tử đã được dự báo nhiều lần nhưng cho đến nay chúng vẫn còn tồn tại, mặc dù mức độ phổ biến không bằng nếu không nói là quá “nhỏ bé” so với lưu trữ ổ đĩa.

Video đang HOT

Bên trái là ổ băng từ IBM 726 (ra mắt năm 1952) có dung lượng lưu trữ 2 MB, bây giờ các băng từ vi tính (tape cartridges) có thể chứa đến 6 TB dữ liệu, vào năm 2022 con số này được dự đoán sẽ là 128 TB. Bên phải là tủ băng từ IBM TS3500 (2013) có dung lượng lên đến 125 PB, cần biết rằng chỉ với 1 PB (1024 TB) là bạn có thể lưu trữ hơn 13 năm video HD.

Theo Genk/ComputerWorld

Tìm hiểu về RAID trên ổ cứng máy tính

Raid có mục đích ban đầu là kết hợp hai hoặc nhiều ổ đĩa cứng vật lý để rồi sau đó tạo ra một thiết bị lưu trữ ảo duy nhất trên hệ thống máy chủ.

Bạn thực sự biết gì về RAID? RAID có phải là backup không? Nói về bảo vệ dữ liệu thì RAID có thực sự là công cụ bảo vệ kho dữ liệu HD của bạn một cách hiệu quả hay không? Bạn hãy cùng tôi thử tìm hiểu về RAID đứng dưới góc độ của dân chơi HD xem nó như thế nào nhé.

Tìm hiểu về RAID trên ổ cứng máy tính - Hình 1

Khi nói đến việc bảo vệ dữ liệu, người ta thường nghĩ đến việc backup dữ liệu và rồi điều đầu tiên mà bạn hay liên tưởng ngay đến đó là RAID. Tôi cũng xin thưa ngay từ đầu - backup không phải là RAID. Có chăng chúng dính dáng nhau một chút trong mục đích bảo vệ dữ liệu mà thôi, còn ngoài ra thì chúng hoàn toàn khác nhau.

Trước tiên tôi xin nói một chút về backup (hai chữ backup luôn viết liền nhau) là gì.

Backup là quá trình sao chép và lưu trữ dữ liệu máy tính để nó có thể phục hồi về bản gốc tại thời điểm trước khi có sự cố mất mát dữ liệu. Xin xem thêm bài viết "Tôi đã bảo vệ dữ liệu của mình như thế nào" để biết về mất dữ liệu là như thế nào. Backup có 2 mục đích rõ ràng:

Thứ nhất, phục hồi các dữ liệu bị mất (vì bất cứ lý do gì).

Thứ hai, phục hồi dữ liệu về trạng thái tại một thời điểm trước đó mà mình muốn.

Bởi vì, như định nghĩa nói, hệ thống sao lưu chứa ít nhất một bản sao của tất cả các dữ liệu quý giá mà nó copy được nên yêu cầu về nơi lưu trữ dữ liệu là rất quan trọng. Việc tổ chức nơi có đủ dung lượng lưu trữ cũng như việc quản lý sao lưu sao cho hiệu quả là cả một quá trình phức tạp. Và chính điều này đã tạo ra sự khác biệt đáng kể so với RAID.

Để được gọi là backup đúng nghĩa nó phải đáp ứng 2 tiêu chí: Offline và offsite.

Offline - Quá trình backup được thực thi cũng như bản backup phải nằm ngoài hệ thống mà nó đang sao lưu dữ liệu. Nói cách khác bình dân cho dễ hiểu. Dữ liệu được sao lưu nằm ở một máy, còn backup phải chạy trên máy khác. Chứ nếu không giả sử như thằng PSU nó chết thì không nói, nghe lời bạn bè làm viên thuốc lắc khiến nó cà giựt làm điện trồi sụt rồi toi cả đám hdd vừa dữ liệu vừa backup thì ta chỉ có nước cắn lưỡi.

Offsite - Máy chạy backup phải nằm ngoài khu vực các máy chủ mà nó đang backup dữ liệu như khác lầu, khác building và nói chung càng xa càng tốt. Việc này nhằm tránh các tình huống thiên tai địch họa cháy nổ làm sụp toàn hệ thống một lúc.

Nhìn chung backup thường được áp dụng cho các doanh nghiệp lớn, nhà băng, cơ quan nhà nước những nơi có những dữ liệu nhiều và quan trọng cần phải bảo vệ (vấn đề bảo mật dữ liệu nằm ngoài phạm vi bài này). Tôi có làm việc với một vài đồng nghiệp (chung công việc nhưng khác bộ phận). Họ phụ trách việc sao lưu và lưu trữ dữ liệu thông tin của cả quốc gia. Mỗi lần làm backup xong (với các dữ liệu đặc biệt quan trọng nhưng không thay đổi thường xuyên), tôi thấy họ có các nhân viên vũ trang đưa xe bọc thép chở các tape dữ liệu vào các hầm chứa ở một nơi ít người được phép biết để cất giữ. Sau này vì lý do an ninh, họ xây hẳn một trung tâm backup và backup qua hệ thống network cáp quang nội bộ (fiber cables 10Gb). Dĩ nhiên backup còn rất nhiều điều lý thú khác như các mức độ backup, các hình thức backup, các phương tiện backup, các vấn đề về nén dữ liệu, encryption, .... Một lần nữa nó lại nằm ngoài phạm vi bài viết nên ai có hứng thú, thì sẽ trao đổi thêm sau.

Tôi cố tình nói hơi kỹ về backup để chúng ta có thể hiểu và sau này dễ dàng phân biệt với Raid.

Ưu điểm của backup thì hầu như ai cũng biết rồi, vậy những điểm yếu của nó là gì?

- Tốn kém thiết bị lưu trữ. Thật vậy, nếu bạn có 1TB mà muốn backup nó thì phải có 1TB nữa để chứa (backup) cái 1TB gốc. Có nén lắm cũng chỉ tiết kiệm chút đỉnh, mà càng nén nhiều thì tỉ lệ thất bại khi giải nén trong quá trình restore càng cao, do đó càng hồi hộp, nguy hiểm.

- Thời điểm backup bị hạn chế. Khi chúng ta phục hồi dữ liệu thì đó chính là dữ liệu tại thời điểm mà chúng ta làm backup mà thôi. Còn các thay đổi dữ liệu ngay sau khi backup được thực thi sẽ không được lưu giữ lại (cái này quan trọng và nên nhớ).

- Thời gian thực hiện backup thường kéo dài so với Raid (thời gian thực).

- Phiền phức, tốn kém thêm khi lưu trữ các backup.

Trở về đề tài chính đó là RAID. Ai cũng biết RAID là tên viết tắt của Redundant Array of Inexpensive Disks hoặc sau này nghe kỹ thuật hơn là Redundant Array of Independent Disks.

Theo trang tài liệu Wiki, Raid lần đầu tiên được phát triển bởi các nhà khoa học máy tính thuộc trường Đại học California tại Berkeley vào năm 1987. Mục đích ban đầu là họ muốn kết hợp hai hoặc nhiều ổ đĩa cứng vật lý để rồi sau đó tạo ra một thiết bị lưu trữ ảo duy nhất trên hệ thống máy chủ. Nói khác đi, OS của máy chủ lúc này chỉ có thể thấy một ổ duy nhất được dựng từ 2 hay nhiều HDD có trong máy.

Tìm hiểu về RAID trên ổ cứng máy tính - Hình 2

Qua quá trình nghiên cứu và sử dụng, phương pháp mới này được bổ sung làm cho nó có thêm 2 khả năng hay hơn so với một ổ HDD đơn độc thông thường.

Thứ nhất: Giải quyết được lỗi hỏng hóc của một (sau này là nhiều hơn) ổ HDD trong RAID.

Thứ hai: tăng hiệu suất đọc/ chép trên RAID.

Nói cách khác, RAID được cải tiến nhằm giúp tăng khả năng chịu lỗi và nâng mức thông lượng I/O throughput cao hơn so với một ổ cứng duy nhất hoặc một nhóm các ổ đĩa cứng độc lập.

Nhớ hồi xưa khi tập làm quen với máy tính, nghe tới Raid ai cũng xanh mặt run tay vì tính chất lưu trữ phức tạp và tương đối đặc biệt của nó. Ngày nay tôi chắc là phần nhiều trong chúng ta nếu cứng tay một chút thì chí ít cũng một vài lần set up một cái Raid cho riêng mình, đặc biệt là khi mức độ lưu trữ ngày càng được nâng lên về dung lượng và cần thiết cho một loạt các ứng dụng client / server.

Có hai khái niệm chính mà ta nên nhớ khi nói về Raid.

1/ Parity

Yếu tố cơ bản để giúp cho ta có thể phục hồi dữ liệu trực tuyến (tức lúc máy chủ vẫn đang vận hành) trong trường hợp một đĩa cứng bị hư hỏng bằng cách sử dụng một hình thức dự phòng được gọi là parity. Để nói cho bình dân đơn giản hơn , parity là phần bổ sung của tất cả các ổ đĩa được sử dụng trong cái Raid đó. Khi ta muốn tạm đọc dữ liệu từ một HDD bị hư nào đó (tôi nói tạm là vì khi ấy tốc độ truy xuất dữ liệu của toàn mảng Raid sẽ rất chậm, chúng chỉ được phục hồi tốc độ khi đã được thay bằng một ổ cứng mới), Raid sẽ thực hiện bằng cách đọc các dữ liệu tốt còn lại và kiểm tra nó bằng cách đối chiếu lại với dữ liệu pairty được lưu trữ trong mảng.

Tôi lấy ví dụ đơn giản để các bạn đễ hình dung Raid đã tính parity như thế nào.

Giả sử ta có 4 ổ cứng tạo nên Raid và lần lượt các ổ cứng này chứa các dữ liệu mang giá trị cũng lần lượt là 1, 2, 3, và 4. Khi đó Raid sẽ gán giá trị của parity là 10 (giả sử thôi chứ thực tế không phải vậy đâu)

1 2 3 4 = 10

Khi ổ thứ 3 bị toi thì ta sẽ có

1 2 X 4 = 10

Để biết cái ổ cứng thứ 3 trước đó có chứa dữ liệu gì, khi đó Raid sẽ tính

7 X = 10 hay X = 10 -7 hay X = 3.

Cũng vì tính toán dài dòng như vậy nên, nếu các bạn để ý, khi một ổ bị tèo trong Raid 5 chẳng hạn, đồng ý là vẫn không có một dữ liệu nào bị mất, nhưng tốc độ truy xuất bị chậm hẳn đi.

Lưu ý parity chỉ được sử dụng ở các cấp độ RAID 2 , 3, 4 , và 5.

RAID 1 không sử dụng parity bởi vì tất cả dữ liệu là hoàn toàn sao chép ( nhân đôi).

Còn RAID 0 chỉ được sử dụng để tăng hiệu suất truy xuất. Vì không trang bị chức năng dự phòng dữ liệu nên nó không có parity .

Một câu hỏi gợi mở đối với các bạn nè. Các bạn đã bao giờ set up một cái Raid 5 trên Windows hay Linux chưa? Nếu có thì có bao giờ gặp một trường hợp là 1 ổ cứng bị hư chưa? Khả năng thành công khi phụ hồi dữ liệu trở lại (sau khi thay ổ cứng mới) là bao nhiêu phần trăm?

2/ Khả năng chịu lỗi hỏng hóc ổ cứng

Ngày nay người ta vẫn còn đang tranh luận gay gắt liệu công nghệ RAID có thật sự bảo vệ dữ liệu hay không? Có ngăn ngừa các lỗi hư ổ đĩa không. Gần đây thôi trên diễn đàn này cũng có vài ý kiến bài bác thẳng thừng Raid. Ví dụ như ở Raid 5, nếu chẳng may có từ 2 ổ cứng rù nhau cùng về chầu Diêm vương thì toàn bộ dữ liệu chết sạch, không cách gì cứu vãn được. Theo ý kiến cá nhân, thì tôi cũng cho là Raid không bảo vệ dữ liệu hoàn hảo như backup, nhưng.... Vâng nhưng RAID cung cấp sự bảo hiểm an toàn nhất định khi nó có thể chống đỡ sự hỏng hóc của ổ đĩa (nhiều hay í thì còn tùy loại Raid) bằng cách cho phép kéo dài thời gian để phục hồi dữ liệu.

Các khả năng chịu lỗi của các Raid cũng có thể được tăng cường đáng kể bằng cách chọn loại Raid lưu trữ đúng đắn (sẽ nói ở sau).

Ở trên ta đã biết parity được Raid tạo ra và tính toán ra sao, thì khi nhìn vào cách phân bố parity trong một Raid, ta có thể biết khả năng chịu lỗi hỏng hóc HDD của Raid đó dư lào ngay, ví dụ:

- Raid 5, các phần tử parity Ap, Bp, Cp, Dp,... được phân bố tuần tự lần lượt trên từng HDD trong Raid. Nếu cộng tất cả lại ta sẽ thấy chúng chiếm vừa đứng dung lượng (nhỏ nhất) của một ở cứng trong Raid đó. Đó là lý do tại sao ta thấy ở các Raid 5, chúng ta phải hy sinh 1 ổ cho Raid và Raid thường bắt (hay nói đúng hơn nó chỉ bảo kê) chúng ta sử dụng các HDD có cùng dung lượng. Thằng HDD nào lớn chuẩn sẽ bị nó vạc bớt ráng chịu. Và cũng từ đây ta có thể biết rằng, trong Raid 5, nó chỉ cho phép 1 HDD toi mạng mà thôi, còn hơn nữa thì khi đó chính người dùng ... toi mạng.

Tìm hiểu về RAID trên ổ cứng máy tính - Hình 3

- Raid 6, cũng tương tợ như Raid 5 thôi, nhưng lần này ta để ý thấy có xuất hiện thêm Aq, Bq, Cq, Dq,... mà nếu ngồi cộng tổng chúng lại sẽ vừa bằng 2 HDD trong Raid. Vâng giống như trên, ta biết dung sai cho phép hard drive chết tối đa chỉ là 2 thôi. Dễ ẹt phải không các bạn?

Tìm hiểu về RAID trên ổ cứng máy tính - Hình 4

Vì đề tài về Raid rất rộng, trong bài này tôi không thể nói cụ thể Raid là gì, nguyên lý họat động của nó ra sao, có mấy cấp độ Raid và chúng khác nhau thế nào, hy vọng đến đây bạn vẫn chưa bị "bơi". Mà muốn biết có đang bị "bơi" hay không dễ lắm. Nếu bạn trả lời được những câu hỏi này thì bạn có thể an tâm đi tiếp phần còn lại của bài:

Backup và Raid 1 giống và khác nhau ở điểm nào?

Tại sao nói Raid ngày nay có khả năng chịu được mức độ hư hỏng của một đến vài ổ cứng trong mảng Raid?

Cái gì làm cho Rai có khả năng đọc/ chép nhanh hơn là các ổ cứng độc lập?

Các yếu tố làm gia tăng sự phát triển của Raid trong giai đoạn hiện nay

Ngày nay ngày càng có nhiều công ty lớn đã tạo ra những mạng lưới nội bộ riêng cho mình trên toàn doanh nghiệp để nâng cao năng suất và sắp xếp luồng thông tin. Trong khi đó thì các cơ sở dữ liệu lại được lưu trữ phân tán trên các máy chủ riêng rẽ. Bằng cách kết hợp nhiều ổ đĩa vào một mảng duy nhất - được xem bởi các hệ điều hành mạng như một ổ đĩa duy nhất, ứng dụng Raid gom về một kho dữ liệu duy nhất trên mạng, nó cung cấp lợi ích đáng kể là giảm chi phí , các khoản tiết kiệm có thể được, đồng thời nhanh chóng phục hồi nếu thông tin thường xuyên bị mất hoặc không thể truy cập.

Các bạn cũng biết, các ứng dụng hiện nay tạo ra các tập tin lớn hơn do đó nhu cầu lưu trữ mạng đã tăng lên tương ứng. Ngoài ra, sự tăng tốc của tốc độ CPU đã vượt xa tốc độ truyền tải dữ liệu để lưu trữ, tạo ra tắc nghẽn trong hệ thống hiện nay. Vì thế giải pháp lưu trữ RAID vượt qua những thách thức này bằng cách cung cấp một sự kết hợp của tính sẵn sàng dữ liệu , hiệu suất nổi bật, khả năng mở rộng, năng suất cao và phục hồi mà không làm mất dữ liệu hoặc gián đoạn truy cập của người dùng.

Các loại RAID

Các bạn biết hiện nay có bao nhiêu loại Raid không? Có người sẽ nhau nhẩu nói ngay Raid 0, Raid 1, Raid 5, v.. v... Không phải bạn ơi, đó chỉ là cấp độ Raid mà thôi và tùy theo nhu cầu lưu trữ và sử dụng mà người ta quyết định chọn lựa cho mình cấp độ Raid nào cho phù hợp.

Còn Raid hiện nay thì tựu chung có 3 loại: Software RAID, Fake RAID và Hardware RAID.

Như đã nói, RAID là mảng đề tài quá lớn, quá rộng, nếu mà nói cho hết, cho đủ thì có lẽ bài viết sẽ phải kéo dài lê thê. Do đó, tôi chỉ nói tóm gọn đặc điểm của từng loại RAID này là gì để sau này bạn cũng có cái cơ sở để phân biệt, không bị người khác chê... &'Hai lúa"!

Các bạn nên nhớ một điều cho dù là loại RAID gì, chúng đều có chung một đặc điểm là chạy trên các mã RAID viết dựa trên phần mềm. Sự khác biệt giữa các loại RAID là nơi mà các mã phần mềm này được thực thi hoặc trên bộ xử lý (CPU) máy chủ (như software RAID, Fake RAID ) hoặc &'bán cái' lại cho một bộ xử lý on-board ( Hardwar RAID).

1/ Software RAID

Cái này thì dễ rồi, sau khi cài xong HĐH, bạn tiến hành dùng luôn Windows để thiết lập RAID (0, 1, 5, gì đó) tùy ý bạn muốn - Windows based RAID. Còn bạn nào sử dụng Linux thì có sẵn mdadm utility không cần suy nghĩ nhiều cho nặng đầu. Ngày nay, đã và đang có khá nhiều software RAID được viết trên nền Linux và ngày càng chứng tỏ khả năng vượt trội so với hai anh kia. Chỉ gói gọn trong một câu như thế này, tôi không nghĩ các bạn sẽ hiểu hết. Vì sự hạn chế độ dài của bài, nên tôi chỉ có thể nói ngắn là basic RAID sẽ dần chết và bị thay thế bởi các software RAID viết dựa trên các mã nguồn mở.

Các software RAID dựa trên phần mềm chủ yếu được sử dụng với các máy lưu trữ gia đình, các máy chủ entry-level . Điểm chủ yếu để nhận diện là nó thực hiện tất cả các lệnh I / O và các thuật toán toán học RAID chuyên sâu trực tiếp trên các CPU của máy chủ lưu trữ. Chính điều này làm chậm hiệu suất hệ thống bằng cách tăng lưu lượng truy cập máy chủ qua PCI bus , sử dụng vào ngay luôn tài nguyên của hệ thống CPU, memory, .... Ưu điểm chính của software RAID là giá thành rẻ hơn (nhiều software RAID cho free luôn) so với các lựa chọn thay thế RAID khác như hardware RAID có mức giá cao hơn nhiều.

2/ Fake RAID hay Host RAID

Tôi không hiểu lắm tại sao người ta lại nói là fake RAID, mà nếu dịch ra tiếng Việt cho sát nghĩa thì nghe nó trớt quớt. Trong khi tôi ưa thích từ Host RAID vì nó sát thực tế hơn. Vậy Fake RAID (RAID giả) là gì?

Tôi chắc rằng có 80 - 90% trong số các bạn không biết gì về nó, thậm chí mới nghe lần đầu trong khi mình xài nó hà rầm mỗi ngày.

Khi bạn mới mua một cái mainboard mới toanh về, trong lúc cài Windows, ta nhấn F6 để cài driver (chắc các bạn vẫn còn nhớ) nhằm để thiết lập RAID trong BIOS bên ngoài Windows. Rõ ràng đâu có gì dính đến software nào đâu vì ngay cả OS còn chưa có huống là. Do đó nó rõ ràng là hardware RAID (hardware là motherboard đó!)

Cũng vậy, khi bạn mới mua một cái card Sata rời 4 hoặc 8 cổng Sata. Ta set up RAID trên những ổ cứng gắn trên nó và cũng chả có cái software tên là A hay B nào can thiệp vào đây. Vâng, rõ ràng nó cũng chính là một hardware RAID.

Không phải thật sự như vậy đâu các bạn ạ. Một lần nữa ta phải bám chắc vào một nguyên lý đơn giản nhưng cơ bản là: Cho dù cái RAID đó được hình thành (xuất sứ) từ đâu một khi nó vẫn còn sử dụng nguồn tài nguyên là chính cái CPU và bộ nhớ memory của máy chủ để hoạt động (tính toán RAID, truy xuất dữ liệu,...) thì nó vẫn bị coi là software RAID như thường. Tuy nhiên vì ở đây nó có liên quan chút đỉnh tới mobo hoặc card rời. Nó sử dụng firmware nhận diện/ đánh giá ổ cứng trước khi HĐH được khởi động. Và sau khi HĐH khởi động xong (lấy quyền kiểm soát lại từ Bios) thì khi đó nó giao quyền điều khiển RAID cho OS luôn. Vì lẽ đó mà nó có tên gọi Host RAID là vậy. Trời, khó quá, thế thì như thế nào mới được gọi là hardware RAID, mặt mũi nó như thế nào?

3/ Hardware RAID

Nó thường ở dưới hình thức là một dạng card add-in. Loại card RAID controller này cắm vào một khe cắm bus chủ PCI. Giảm tải hệ thống máy chủ trong một số hoặc tất cả các lệnh I / O, dành các hoạt động tính toán RAID cho một hoặc nhiều bộ vi xử lý thứ cấp mà nó có.

Ngoài việc cung cấp những lợi ích chịu lỗi của một RAID thông thường , bộ điều khiển hardware RAID còn thực hiện các chức năng kết nối tương tự như bộ điều khiển trên máy chủ tiêu chuẩn. Và cũng bởi nhờ nó có riêng cho mình tài nguyên (CPU, memory,...) , nên chúng thường cung cấp hiệu suất cao nhất cho tất cả các loại RAID. Hardware RAID cũng cung cấp tính năng chịu lỗi mạnh mẽ hơn đa dạng hơn software RAID. Ví dụ như RAID 0/1/5/6/10/50/60. Thế bạn thường gặp hardware RAID ở đâu? Có phần nhiều các bạn sẽ ít có cơ hội mua chúng vì giá quá chát hoặc thấy chúng (vì thường được trang bị để xây dựng các siêu hệ thống lưu trữ dung lượng cao nơi các máy chủ cao cấp) .

Theo tôi biết, vài cái tên nổi tiếng được các tay có máu mặt trang bị cho các file servers tại gia là 3ware, Areca, Intel, LSI vì chúng đem lại hiệu suất thực sự. Còn giá thì vô chừng từ vài trăm đến cả ngàn USD tùy theo con chip đi theo nhanh hay chậm, dung lượng memory tích hợp, số cổng Sata có thể kết nối, v..v...

Ví dụ như em này: 3ware 9650SE-8LPML PCI Express SATA II Controller Card RAID

Tìm hiểu về RAID trên ổ cứng máy tính - Hình 5

Tóm lại, đứng dưới góc nhìn của dân lưu trữ HD, khi mà dung lượng phim ảnh nhạc nhẽo ngày càng phình to ra thì nhu cầu tìm hiểu về RAID để trợ giúp cho việc lưu trữ trở nên một chủ đề nóng và nó quan trọng hơn bao giờ hết.

Đáng tiếc bài này không thể dài hơn nên chỉ cho ta một cái nhìn tổng quan bao gồm tất cả hóa thân của RAID thôi chứ không bao gồm chiều sâu trong chúng. Một đều an ủi là, chí ít qua bài này, bạn hiểu được phần nào về RAID để từ đó có quyết định đúng đắn khi lựa chọn một phương pháp bảo vệ cho kho lưu trữ dữ liệu HD của mình.

Theo VNE

Bạn thấy bài viết này có hữu ích không?
Có;
Không

Tin liên quan

Tin đang nóng

Hóng: Người đẹp Vbiz đã có bạn trai, rầm rộ tin hẹn hò đồng giới chỉ là cú lừa?
22:33:01 05/11/2024
Siêu thảm đỏ hot nhất Cbiz: Triệu Lộ Tư mặc sến lép vế trước dàn mỹ nhân, Bạch Lộc đụng độ "tình địch" Ngu Thư Hân
20:35:30 05/11/2024
Đen Vâu lộ diện sau thời gian dài ở ẩn giữa tin đồn lên chức "bố bỉm"
21:47:13 05/11/2024
Vợ chồng Khánh Vân, Quốc Trường cùng dàn sao đổ bộ Phú Quốc dự hôn lễ một cặp đôi Vbiz!
20:53:14 05/11/2024
20 trẻ mầm non nhập viện nghi ăn nhầm thuốc chuột: Cô Hiệu phó tiết lộ lý do
21:57:23 05/11/2024
Con gái MC Quyền Linh trả lời nghi vấn thẩm mỹ ở tuổi 16, hút 2 triệu lượt xem
21:00:58 05/11/2024
Ca sĩ Quốc Kháng vừa bị bắt vì lừa chạy án giá 9 tỉ đồng là ai?
23:13:51 05/11/2024
Thực đơn tiệc sinh nhật trong tù của Sean 'Diddy' Combs gây sốc
23:22:24 05/11/2024

Tin mới nhất

Nâng cao và biến đổi hình ảnh của bạn bằng trình chỉnh sửa video trực tuyến CapCut

15:45:56 16/01/2024
Đã đến lúc bỏ lại các công cụ chỉnh sửa cũ và chấp nhận giải pháp thay đổi cuộc chơi. Gặp gỡ Trình chỉnh sửa video trực tuyến CapCut - giải pháp sẽ nâng cao, nâng cao và cách mạng hóa thế giới sáng tạo nội dung trực quan của bạn

Cách đăng Facebook để có nhiều lượt thích và chia sẻ

22:01:27 21/12/2022
Chắc hẳn là ai trong chúng ta cũng luôn muốn các bài đăng trên Facebook có được nhiều lượt thích và chia sẻ. Tuy nhiên, làm thế nào để tối ưu bài đăng thì không phải ai cũng biết

Thêm nhiều bang của Mỹ cấm TikTok

21:03:46 21/12/2022
Louisiana và Tây Virginia là hai bang mới nhất cấm công chức sử dụng TikTok trên thiết bị công do lo ngại Trung Quốc có thể theo dõi người Mỹ và kiểm duyệt nội dung

Microsoft cấm khai thác tiền điện tử trên các dịch vụ đám mây để bảo vệ khách hàng

20:03:41 21/12/2022
Microsoft đã cập nhật thỏa thuận cấm khai thác tiền điện tử trên các dịch vụ trực tuyến của mình. Việc khai thác tiền điện tử trên dịch vụ của Microsoft cần có sự cho phép bằng văn bản của công ty, nhưng cũng chỉ nhằm mục đích thử nghiệ...

Facebook trấn áp hàng loạt công ty phần mềm gián điệp

20:01:24 21/12/2022
Meta (công ty mẹ của Facebook) cho biết họ đã ngăn chặn không dưới 200 hoạt động bí mật, trấn áp hàng loạt công ty phần mềm gián điệp kể từ năm 2017 tại khoảng 70 quốc gia

Meta đối mặt cáo buộc vi phạm các quy tắc chống độc quyền với mức phạt 11,8 tỷ đô

19:01:39 21/12/2022
Ủy ban Châu Âu - cơ quan điều hành của EU cho biết, đã phát hiện Meta vi phạm các quy tắc chống độc quyền của EU bằng cách bóp méo sự cạnh tranh trên thị trường quảng cáo trực tuyến. Meta có thể phải đối mặt với khoản tiền phạt lên tới ...

Không cần thăm dò, Musk nên sớm từ chức CEO Twitter

15:01:33 21/12/2022
Người dùng Twitter, các nhà đầu tư Tesla và chuyên gia phân tích trong ngành đều cho rằng Elon Musk nên sớm từ chức CEO Twitter

Đại lý Việt nhập iPhone 14 kiểu 'bia kèm lạc'

14:01:42 21/12/2022
Muốn nhập được các mẫu bán chạy như iPhone 14 Pro/Pro Max, các chuỗi đại lý bán lẻ ủy quyền của Apple bắt buộc phải nhập thêm hàng loạt phụ kiện đi kèm

Khai trương hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR tại Quần thể Di tích Cố đô Huế

09:38:18 21/12/2022
Sáng 20/12, tại Ngọ Môn, Đại Nội Huế, Trung tâm Bảo tồn Di tích Cố đô Huế đã tổ chức Lễ Khai trương Hệ thống vé điện tử và dịch vụ trải nghiệm thực tế ảo XR

'Dở khóc dở cười' với tính năng trợ giúp người bị tai nạn ôtô của Apple

09:37:54 21/12/2022
Tính năng phát hiện tai nạn ôtô mới ra mắt trên Apple iPhone và Apple Watch sẽ tự động tìm kiếm sự trợ giúp từ bộ phận cấp cứu khi có nguy cơ xảy ra tai nạn

Xiaomi sa thải hàng nghìn nhân sự

09:35:12 21/12/2022
Gã khổng lồ smartphone Trung Quốc Xiaomi đang lên kế hoạch sa thải 15% trong số hơn 30.000 nhân sự trong bối cảnh công ty gặp khó khăn

Apple sẽ bắt đầu sản xuất MacBook tại Việt Nam vào giữa năm 2023

09:34:00 21/12/2022
Đối với Trung Quốc, việc mất vị trí độc quyền sản xuất MacBook tượng trưng cho vị thế công xưởng thế giới của Trung Quốc đang bị suy yếu

Có thể bạn quan tâm

Bố chồng mỉa mai thông gia "nhiều nhà cửa, đất đai nhưng không đẻ được con trai"

Góc tâm tình

06:29:32 06/11/2024
Bố tôi không chấp nhưng tôi bỗng thấy lo lắng cho tương lai của chính mình. Bố mẹ tôi có 3 cô con gái, tôi là út trong nhà nên được cả bố mẹ và 2 chị yêu thương, chiều chuộng vô cùng.

Từ vụ 'quái xế' đâm tử vong người đi đường: Hà Nội cần quyết liệt xử lý

Tin nổi bật

06:27:51 06/11/2024
Sau vụ tai nạn khiến 1 người đang dừng chờ đèn đỏ tử vong, nhiều người bày tỏ mong muốn lực lượng chức năng vào cuộc quyết liệt để xử lý dứt điểm nạn quái xế gây náo loạn đường phố.

Thân nhân cô gái bị 'quái xế' tông tử vong mong vụ việc được xử nghiêm

Pháp luật

06:21:58 06/11/2024
Thân nhân cô gái bị quái xế tông xe tử vong tại Hà Nội mong vụ việc được xử lý nghiêm để chuyện đau lòng không lặp lại với những gia đình khác.

4 tháng sau chia tay, "ngọc nữ Thái Lan" khoe eo mỏng như giấy, cơ bụng đẹp chưa từng thấy

Người đẹp

06:19:07 06/11/2024
Baifern Pimchanok là một trong những mỹ nhân hàng đầu xứ chùa Vàng với nhan sắc xinh đẹp cùng lượng người hâm mộ đông đảo.

Con trai nuôi Ngọc Sơn: "Bị sập sân khấu cao 3m, tôi tưởng chết ở đó rồi"

Tv show

06:13:29 06/11/2024
Lần đó tôi về quê biểu diễn, bà con ùa lên sân khấu mấy trăm người để tặng hoa tôi, tới mức sập sân khấu. Bị sập sân khấu cao 3m, tôi tưởng chết ở đó rồi

Tình duyên lận đận của nữ diễn viên xinh đẹp nhất nhì VTV: Sinh con thứ 2 vẫn chọn làm mẹ đơn thân

Sao việt

06:09:41 06/11/2024
Xinh đẹp, tài năng nhưng đường tình duyên của nữ diễn viên này khá truân chuyên. Song cô không xem việc thất bại trong hôn nhân là bất hạnh.

Bí quyết làm món bánh ăn sáng từ cà rốt giòn tan, ngọt ngào, bổ dưỡng với công thức cực kỳ đơn giản

Ẩm thực

06:04:02 06/11/2024
Đây là một món ăn nhẹ lý tưởng cho bữa sáng, bữa xế chiều hoặc bất kỳ lúc nào bạn muốn thưởng thức một món ăn ngon miệng và dễ làm.

Liên hoan phim Berlin rời bỏ mạng xã hội X của tỉ phú Elon Musk

Hậu trường phim

06:02:16 06/11/2024
Liên hoan phim Berlin đưa ra quyết định rời khỏi nền tảng mạng xã hội X của tỉ phú Elon Musk sau động thái tương tự của giám đốc Liên hoan phim Venice, Alberto Barbera.

Nữ luật sư lên tiếng về tin đồn hẹn hò Johnny Depp

Sao âu mỹ

06:00:36 06/11/2024
Luật sư của Johnny Depp, Camille Vasquez nói cô thấy tài tử phim Cướp biển vùng Caribe đáng yêu nhưng anh không phải là mẫu người cô muốn hẹn hò.

Qatar trưng cầu ý dân về việc bãi bỏ bầu cử Quốc hội

Thế giới

05:48:43 06/11/2024
Chính quyền Qatar gọi đây là "cuộc thử nghiệm" và đề xuất thay đổi Hiến pháp. Theo đề xuất, toàn bộ số ghế trong Hội đồng Shura sẽ lại do Quốc vương Sheikh Tamim bin Hamad Al-Thani bổ nhiệm.

Tình thế đảo ngược với Enzo Fernandez ở Chelsea

Sao thể thao

23:33:20 05/11/2024
Inter Milan và Barcelona sẵn sàng thực hiện một động thái chuyển nhượng bất ngờ dành cho Enzo Fernandez khi cầu thủ này đối diện với tương lai bất định tại Chelsea.