Aktualności
2011-02-17
Globalna kopia danych
Rozmowa z  doktorem Norbertem Meyerem, kierownikiem usług powszechnej archiwizacji w projekcie PLATON
Co było motorem napędowym do stworzenia usługi powszechnej archiwizacji wramach projektu PLATON?  Czy taką potrzebę zgłaszali PCSS sami naukowcy, bo nagminnie mieli problem z przechowywaniem danych?

PCSS zaczęło realizować tą usługę już jakiś czas temu. W samym projekcie PLATON jest ona niejako wdrożeniem oprogramowania. Kupujemy tutaj sprzęt, komputery, duże biblioteki taśmowe, aw PLATONIE zaczynamy to wdrażać. Także mieliśmy o tyle ułatwione zadanie, że oprogramowanie było już gotowe. Mówimy o Krajowym Magazynie Danych, który będzie wdrożony na sprzęcie, który był w PLATONIE. To tak w dużym uproszczeniu, ale oczywiście są problemy związane z wdrożeniem, ze skalą, bo to jest usługa ogólnopolska i o wiele większa skala, niż ta, która była w KMD. Odnośnie zapotrzebowania, doświadczenia były już z racji KMD, gdzie powstało oprogramowanie, które miało jakąś genezę, bazę i było związane z zapotrzebowaniem użytkowników. Także odpowiedź brzmi tak, to wynikało z zapotrzebowania. Realizowaliśmy w ramach PLATONA już warsztaty, w których uczestniczyli użytkownicy i było widać, że chcą z tego skorzystać, jest to potrzebne. Np. biblioteki, gdzie następuje cyfryzacja danych i są duże ilości danych, aokazuje się, że biblioteki nie maja takiego sprzętu, żeby gdzieś później te dane składować.

Jak instytucje korzystające obecnie z Krajowego Magazynu Danych radziły sobie z danymi zanim zaczęły korzystać z KMD, trzymały dane na zwykłych nośnikach, takich jak dyskietki czy płyty CD?


Jeśli chodzi o backupy, nie chcę powiedzieć, że każdy radził sobie sam, czy jak mógł, ale tych danych było dużo mniej, więc można było je sobie backupować, no może nie na dyskietkach, ale na CD-ROMach na przykład. Poza tym, te jednostki też w jakiś sposób archiwizowały te dane, myśmy udostępniali te archiwizatory dla użytkowników. Jeżeli ktoś był zainteresowany z tych użytkowników, którzy mają granty obliczeniowe i liczą na dużych maszynach, to takie backupy były robione. Natomiast w Krajowym Magazynie Danych zaczęliśmy mówić owszystkich użytkownikach, bo każdy potrzebuje w pewnym momencie zrobić sobie kopię, chciałby, czy powinien nawet ją zrobić. Nie wszyscy robią. Problem jest wtedy, kiedy te dane później znikają, bo uszkodził się dysk, bo zawiesił się system operacyjny. I na to nałożyła się również świadomość. Ludzie mają coraz więcej danych i wiedzą, że jednak te dane powinny być gdzieś backupowane. Ta usługa jest natomiast bardziej zaawansowana. Dane możemy sobie backupować zkomputera osobistego na CD-ROMie czy gdzieś lokalnie, ale było kilka przypadków, kiedy się okazało, że to miejsce, wktórym jest komputer i serwer, backupujemy w tym samym miejscu, też może ulec zniszczeniu. I dlatego mówimy ozdalnym backupowaniu. To jest taka usługa, której możemy sobie kopię zrobić lokalnie, ale zwiększamy ten poziom bezpieczeństwa i wynosimy drugą kopie gdzieś na zewnątrz, taki też jest charakter usługi.

W PLATONIE duży nacisk kładziony jest na bezpieczeństwo danych, powiedzmy cos więcej o tym bezpieczeństwie, bo wiemy, że zusługi archiwizacji korzystać będą uczelnie, a te dysponują dużą ilością np. danych osobowych, których wyciek mógłby być groźny.

Bez względu na to, czy chodzi o dane osobowe, czy każde inne, jeśli nie są one podane do wiadomości publicznej, to znaczy, że osoby będące w posiadaniu tych danych nie chcą ich udostępniać. Każdy znas ma takie obawy, że w momencie, kiedy taki backup zostaje zrobiony z naszego laptopa czy komputera, to ktoś może do tych danych sięgnąć, a mamy tam jakieś finansowe rzeczy, PIT-y, wiadomo, nie chcemy ich udostępniać. Podobnie jest z uczelniami czy firmami. To są dane finansowe, marketingowe, jednym słowem dane poufne. Mamy taką funkcjonalność, która pozwala zabezpieczyć te dane. Polega to na ich szyfrowaniu. One mogą być zaszyfrowane po stronie użytkownika, w momencie, kiedy wychodzą zkomputera użytkownika. Poziom tego szyfru jest na tyle duży, że daje duże bezpieczeństwo w dostępie nieautoryzowanym.

Jak fizycznie wygląda taki proces archiwizowania?


Jest 10 miast, w których dane można fizycznie archiwizować. Pięć jest większych, pięć jest mniejszych, ma to taki charakter rozproszony. Daje to efekt niezawodności. Jeżeli dostęp do zasobów PCSS będzie utrudniony, to Krajowy Magazyn Danych zapewni archiwizację w innym miejscu, Krakowie, Warszawie, Kielcach… Poza tym, stworzyliśmy profile użytkownika, w których określa się wjaki sposób dana jednostka, czy osoba fizyczna chciałaby te dane składować. Czyli czy to ma być raz w miesiącu, czy to mają być dane przyrostowe, wtedy archiwizuje się mniejsze dane, tylko z tych zmian, które były wykonywane danego dnia lub tygodnia. Inna funkcja jest taka, że można składować dane tylko w jednym mieście, nie wynosząc tego w inne miejsce. Istnieje również taka możliwość.  Albo odwrotnie, jest możliwość posiadania danych, konkretnie, w Pozna- niu i Warszawie, zwiększając jeszcze dodatkowo poziom bezpieczeństwa.

Kiedy nastąpi całkowite wdrożenie tej usługi i czy każda jednostka naukowa w Polsce będzie mogła zniej skorzystać?

Pewnie są jednostki, które nie czują potrzeby archiwizacji albo mają swoje systemy, a być może ze względu na przepisy, nie mogą swoich danych udostępniać poza swoją jednostkę. Użytkownicy będą mogli przetestować tą usługę, składować dane, a kiedy to ruszy produkcyjnie, te dane zostaną przeniesione na duży system.

Czyli ta usługa już funkcjonuje w zasadzie?


Sama usługa wiąże się z tym, że musi być sprzęt, czyli biblioteki taśmowe, macierze dyskowe. Jeśli ktoś dysponuje takim sprzętem, może sobie na nim zainstalować Krajowy Magazyn Danych ikorzystać z takiej usługi. I to była nawet jedna z funkcji projektu badawczego, w którym zakładaliśmy, że ktoś może chcieć skorzystać z tej licencji i sobie to zainstalować. Natomiast potrzebny jest ten sprzęt, te petabajty, gdzie dane będą mogły być składowane. I to też jest problem jednostek. Pieniądze inwestycyjne nie zawsze są takie duże, albo w ogóle nie przeznaczone na IT, więc nie wszyscy się decydują na backupy. To w którymś momencie później wychodzi. Podobnie jak w ubezpieczeniach. Prawdopodobieństwo wystąpienia szkody jest małe, ale jest. Można się nie ubezpieczyć iwtedy zaoszczędzona kwota może się okazać zyskiem. Ale jeżeli nastąpi duża szkoda, to może okazać się, że lepiej było się ubezpieczyć. Backupy to jest coś podobnego. To jest zabezpieczenie się na ewentualność utraty danych, która nie zawsze następuje.

Dziękuję za rozmowę.

Rozmawiama Kinga Jurga