Aktualności
2011-02-16
PLATON: Usługi powszechej archiwizacji
Żyjemy w czasach nazywanych erą informacji. Nasza cywilizacja generuje olbrzymie ilości danych, przez co ciągle rośnie zapotrzebowanie na ich bezpieczne iefektywne przechowywanie. Analizy organizacji IDC prognozują, że w 2010 roku ludzkość wyprodukuje ok. 1800 exabajtów (1 exabajt = 1 000 000 000 gigabajtów) danych.
W Polsce szczególnie dużym producentem informacji jest sektor naukowo-akademicki. Jednostki badawczo- rozwojowe, instytucje naukowe, uczelnie, szpitale kliniczne, biblioteki cyfrowe, a także akademickie centra komputerowe i operatorzy sieci miejskich borykają się z problemem zarządzania szybko rosnącą ilością danych. Wskali całego kraju jest to przyrost sięgający setek petabajtów rocznie. Wychodząc naprzeciw tym potrzebom, jednym zcelów projektu PLATON stało się udostępnienie zestawu usług powszechnej archiwizacji, mających pomóc instytucjom iużytkownikom w zabezpieczeniu ich danych.

Podstawową potrzebą producentów danych jest odpowiednio duża przestrzeń do ich przechowywania. Z ekonomicznego punktu widzenia korzystna byłaby konsolidacja pamięci masowych. Oznacza to przejście od przechowywania danych na lokalnych systemach, poprzez użycie specjalistycznych serwerów danych, do wykorzystania centrów przechowywania (ang. data center). W ramach centrów danych możliwe jest wprowadzenie bardziej efektywnych, elastycznych i bezpiecznych rozwiązań, takich jak: macierze dyskowe, biblioteki taśmowe, sieci SAN (ang. Storage Area Network), a także oprogramowanie do hierarchicznego przechowywania danych (ang. HSM - Hierarchical Storage Management). Wykorzystanie skonsolidowanego systemu przechowywania lub budowa własnego centrum danych są jednak opłacalne jedynie przy odpowiednio dużej skali przedsięwzięcia.

Tymczasem sama przestrzeń przechowywania to jedynie wierzchołek góry lodowej. Wiele problemów wiąże się zszeroko pojętym zabezpieczeniem danych. Najbardziej dotkliwa byłaby całkowita utrata danych, np. wskutek klęski żywiołowej, takiej jak powódź czy pożar lub awarii, aktów wandalizmu czy kradzieży sprzętu. Odpowiednio wyposażone centra komputerowe oraz technologie redundancji przechowywania danych (np. RAID, ang. Redundant Arrray of Independent Disks) do pewnego stopnia zwiększają bezpieczeństwo informacji, jednak jego wysoki poziom może dać jedynie kopiowanie danych do kilku geograficznie odległych lokalizacji. To zkolei wymaga zastosowania zaawansowanego oprogramowania zarządzającego danymi i systemem przechowywania tak, aby proces replikacji odbywał się automatycznie, w sposób wydajny i zapewniający równoważenie obciążenia infrastruktury, a przede wszystkim integralność danych. Ale to nie jedyne zagrożenia. Informacje chronić trzeba też przed przestępstwami informatycznymi takimi jak złośliwe usunięcie danych, ich modyfikacja, kradzież czy blokowanie dostępu. Taką ochronę może dać stosowanie odpowiednich protokołów przesyłania danych, mechanizmów szyfrowania informacji i autoryzacji użytkowników oraz zabezpieczeń programowych i sprzętowych (np. kontrola dostępu, firewall), precyzyjnie skonfigurowanych przez specjalistów zajmujących się bezpieczeństwem.

Opisanych wyżej wymagań nie jest wstanie spełnić większość instytucji naukowych i akademickich, ze względu na brak kadry specjalizującej się w problematyce zabezpieczania danych i zaawansowanych systemów informatycznych. Rozwiązaniem dla nich może być więc przeniesienie problemu na zewnętrzną instytucję (ang. outsourcing). Odpowiednimi zasobami do realizacji tych wymagań dysponuje dziesięć ośrodków biorących udział w projekcie PLATON. Usługi powszechnej archiwizacji oparte zostały osieć PIONIER, zakupiony w ramach projektu PLATON sprzęt i oprogramowanie do przechowywania danych, a także wykwalifikowaną i doświadczoną kadrę. Potrzebne oprogramowanie zostało też stworzone w ramach projektu badawczego „Krajowy Magazyn Danych”.

Usługi powszechnej archiwizacji obejmują: archiwizację danych, tworzenie iodtwarzanie kopii zapasowych (ang. backup) oraz składowanie danych w tzw. wirtualnym systemie plików. Usługi dostępne są on-line przez całą dobę, 7 dni w tygodniu. W 10 polskich miastach (Gdańsk, Białystok, Warszawa, Poznań, Łódź, Kraków, Lublin, Kielce, Częstochowa, Wrocław) rozmieszczone są węzły przechowywania danych oraz węzły usługowe, połączone z optycznymi sieciami miejskimi (zapewniając odpowiednią przepustowość tzw. ostatniej mili) i siecią krajową (zapewniając odpowiedniej jakości połączenia szkieletowe). W każdym z tych ośrodków bezpośrednie wsparcie dla klienta świadczą specjaliści Konsorcjum PIONIER. To pierwsze rozwiązanie o tak dużym zasięgu w skali kraju.

Usługa kopii zapasowych i archiwizacji dostarczana jest w postaci specjalnej aplikacji działającej w systemie komputerowym użytkownika, która pozwala na optymalizację czasu wykonania kopii oraz jej objętości poprzez wsparcie dla kopii przyrostowych oraz wielowątkowego, równoległego zapisu danych do wielu serwerów. Równoległy backup pozwala na pełne wykorzystanie dostępnego pasma sieciowego, a wykorzystanie wielu serwerów zapewnia kopiowanie informacji równocześnie do wielu centrów przecho- wywania danych. Ponadto, dzięki temu, że aplikacja działa na komputerze użytkownika, składowane przez nią dane mogą być szyfrowane jeszcze przed opuszczeniem systemu komputerowego użytkownika przy użyciu klucza kryptograficznego znanego tylko klientowi usługi.

Już na etapie projektowania systemu wysoki priorytet nadano bezpieczeństwu ipoufności danych. Usługa kopii zapasowych i archiwizacji daje możliwość zaszyfrowania informacji jeszcze przed przesłaniem ich do systemu, a także automatyczną kontrolę integralności pobieranych danych. W przypadku wirtualnego systemu plików ewentualne szyfrowanie pozostaje w gestii użytkownika, jednakże komunikacja z systemem odbywa się przy zastosowaniu wspomnianych bezpiecznych i standardowych protokołów, co ułatwia integracje usług systemu z narzędziami realizującymi dodatkowe techniki kryptograficzne. Wewnątrz systemu poufność komunikacji zapewniają bezpieczne połączenia w ramach sieci PIONIER. Ponadto, wirtualny system plików oferuje oddzielne przestrzenie nazw i oddzielne bazy meta-danych dla różnych instytucji-klientów. Takie rozwiązanie, nowatorskie względem dostępnych na rynku produktów, powoduje wysoki poziom izolacji danych i meta-danych (zwiększona poufność) i daje potencjał do rozbudowy systemu bez utraty wydajności. Dodatkowe zabezpieczenia to przechowywanie i weryfikacja sum kontrolnych (na poziomie wirtualnego systemu plików), sprzętowe szyfrowanie ideszyfrowanie plików (na poziomie napędów taśmowych i napędów w macierzach dyskowych) a także audyty bezpieczeństwa oprogramowania i konfiguracji systemu prowadzone cyklicznie przez konsorcjum w infrastrukturze PLATONA.

Większość instytucji naukowo-badawczych czy akademickich w Polsce ma rosnące potrzeby związane z przecho- wywaniem danych, jednak najczęściej nie dysponuje potencjałem technologicznym pozwalającym stawić czoło temu wyzwaniu. Dla tych instytucji powstały usługi powszechnej archiwizacji w ramach projektu PLATON. Są one realizowane poprzez konsorcjum ośrodków superkomputerowych i sieciowych doświadczonych w dziedzinie przechowywania danych oraz realizacji zaawansowanych usług informatycznych. Posiadają one odpowiednie zasoby, począwszy od fizycznych nośników danych, poprzez geograficznie rozproszoną infrastrukturę (wiele centrów danych wyposażonych w nowoczesny sprzęt do przechowywania danych) iszybką sieć PIONIER łączącą elementy tej infrastruktury, po wysoce wykwalifikowaną kadrę. Usługi powszechnej archiwizacji pozwalają przenieść zadanie długoterminowego przechowywania i zabezpieczenia masowych ilości danych zinstytucji naukowych czy akademickich na posiadające odpowiednią infrastrukturę konsorcjum PLATON.

Maciej Brzeźniak, PCSS