Firma ExaGrid przyjrzała się pierwszej generacji tradycyjnych podejść do deduplikacji danych i zauważyła, że wszyscy dostawcy stosowali deduplikację na poziomie bloków. Ta tradycyjna metoda dzieli dane na „bloki” o wielkości od 4 KB do 10 KB.
Firma ExaGrid przyjrzała się pierwszej generacji tradycyjnych podejść do deduplikacji danych i zauważyła, że wszyscy dostawcy stosowali deduplikację na poziomie bloków. Ta tradycyjna metoda dzieli dane na „bloki” o wielkości od 4 KB do 10 KB.
Oprogramowanie do tworzenia kopii zapasowych, ze względu na ograniczenia procesora, wykorzystuje bloki o stałej długości 64 KB do 128 KB. Wyzwanie polega na tym, że na każde 10 TB danych do backupu (zakładając bloki 8 KB), tabela śledzenia – lub „tablica hashowa” – wynosi miliard bloków. Tablica haseł jest tak duża, że musi być umieszczona w jednym kontrolerze front-end z dodatkowymi półkami dyskowymi, co nazywane jest „skalowaniem”. W związku z tym w miarę wzrostu ilości danych zwiększa się tylko pojemność, a ponieważ nie dodaje się dodatkowej szerokości pasma ani zasobów przetwarzania, okno backupu wydłuża się wraz ze wzrostem ilości danych. W pewnym momencie okno backupu staje się zbyt długie i konieczny jest nowy kontroler front-end, tak zwany „upgrade wózka”. Jest to kłopotliwe i kosztowne.
Ponieważ deduplikacja odbywa się w trybie inline, na drodze do dysku, wydajność backupu jest bardzo niska, ponieważ deduplikacja danych wymaga dużych nakładów obliczeniowych. Ponadto wszystkie dane są deduplikowane i przy każdym żądaniu muszą być ponownie złożone (rehydracja danych).
Efektem jest powolne tworzenie kopii zapasowych, powolne przywracanie danych i okno zapasowe, które rośnie wraz z przyrostem danych (z powodu skalowania).
Unikalna oferta wartości ExaGrid
Przechowywanie kopii zapasowych w warstwach ExaGrid: Szczegółowy opis produktu
Tiered Backup Storage firmy ExaGrid podąża bardziej innowacyjną drogą. ExaGrid wykorzystuje deduplikację na poziomie stref, która dzieli dane na większe „strefy”, a następnie przeprowadza detekcję podobieństw w strefach. Podejście to pozwala uzyskać to, co najlepsze. Po pierwsze, tabela śledzenia ma rozmiar 1.000-tej wielkości w porównaniu z podejściem blokowym i umożliwia korzystanie z pełnych urządzeń w rozwiązaniu typu scale-out. W miarę wzrostu danych dodawane są wszystkie zasoby: procesor, pamięć i pasmo oraz dysk. Jeżeli dane podwajają się, potrójnie, poczwórnie itd., ExaGrid podwaja, potrójnie i poczwórnie zwiększa procesor, pamięć, pasmo i dysk, tak że wraz z przyrostem danych okno backupu ma stałą długość. Po drugie, podejście strefowe jest niezależne od aplikacji backupu, dzięki czemu ExaGrid może obsługiwać praktycznie każdą aplikację backupu. Wreszcie, podejście ExaGrid nie utrzymuje bardzo dużej, stale rosnącej tablicy hashowej i dzięki temu unika konieczności stosowania kosztownej pamięci flash w celu przyspieszenia przeglądania tablicy hashowej. Podejście ExaGrid utrzymuje koszt sprzętu na niskim poziomie.
ExaGrid zapewnia unikalną strefę lądowania (front-end disk-cache Landing Zone), w której kopie zapasowe są zapisywane bez kosztów ogólnych deduplikacji. Ponadto, najnowsze kopie zapasowe są przechowywane w Landing Zone w formacie bez deduplikacji w rodzimej aplikacji do tworzenia kopii zapasowych. Efektem jest najszybsze tworzenie kopii zapasowych i najszybsze przywracanie danych.
Podsumowując, deduplikacja na poziomie bloków napędza architekturę skalowalną, która dodaje dysk tylko w miarę wzrostu danych, lub w przypadku podejścia opartego na węzłach skalowalnych wymaga kosztownej pamięci flash do wykonywania dużych przeglądów tabeli haseł. Ponieważ deduplikacja na poziomie bloków jest wykonywana w trybie inline, cofanie i przywracanie danych jest powolne. Rozwiązanie Tiered Backup Storage firmy ExaGrid z deduplikacją na poziomie strefowym obejmuje pełne urządzenia serwerowe w rozwiązaniu typu scale-out, bez konieczności wykonywania dużych przeglądów tabeli haseł, co skutkuje najszybszym wykonywaniem kopii zapasowych i przywracaniem danych za najniższą cenę. Podejście ExaGrid wspiera również szeroki zakres obsługi aplikacji do tworzenia kopii zapasowych. To podejście Tiered Backup Storage zapewnia to, co najlepsze ze wszystkich światów: ExaGrid może współpracować z każdą aplikacją do tworzenia kopii zapasowych i może być łatwo skalowany, dzięki czemu uzyskuje się okno backupu o stałej długości, niezależnie od wzrostu danych. Podejście Tiered Backup Storage zapewnia to, co najlepsze: wydajność, skalowalność i niskie koszty.