Jak się nie dać zamknąć

License

This article is double-licensed under the Creative Commons Attribution-ShareAlike License and the GNU Free Documentation License. Contact the author if you are interested in other forms of licensing.

Copyright © 2010 Michał Kosmulski.

Creative Commons License This document is licensed under the Creative Commons Attribution-ShareAlike License

Permission is granted to copy, distribute and/or modify this document under the terms of the GNU Free Documentation License, Version 1.2 or any later version published by the Free Software Foundation; with no Invariant Sections, no Front-Cover Texts, and no Back-Cover Texts. A copy of the license is included in the section entitled "GNU Free Documentation License".

Wstęp

Artykuł p.t. „Jak się nie dać zamknąć” po raz pierwszy ukazał się w Tygodniku Powszechnym 22 (3177) 30. maja 2010. Zaktualizowana wersja jest dostępna poniżej.

English summary: „Jak się nie dać zamknąć” was originally published in Tygodnik Powszechny 22 (3177) on May 30th, 2010. It introduces the subject of open standards and open file formats as well as their meaning for the public sector. Updated text is available below.

Jak się nie dać zamknąć

Pozornie błahe decyzje urzędników dotyczące informatyki mogą kosztować podatników miliony złotych rocznie lub spowodować utratę bezcennych danych. Niebezpieczeństwo jest tym większe, że znaczna część użytkowników i decydentów o nim nie wie.

Tekst wydrukowany na papierze może się wydawać mało nowoczesny. Ma jednak tę zaletę, że do jego przeczytania nie potrzeba żadnych specjalnych urządzeń ani oprogramowania. Inaczej jest z dokumentem elektronicznym. Przy całym bogactwie funkcji praca komputerów sprowadza się do prostych, za to szybkich operacji na liczbach. Wszystkie dokumenty: tekstowe, graficzne czy multimedialne, muszą więc być zapisane jako ciągi liczb. Sposób zamiany tych liczb na czytelną dla człowieka formę i vice versa określa zbiór reguł zwany formatem dokumentu lub formatem danych.

Istnieje wiele konkurencyjnych rozwiązań do przechowywania dokumentów każdego rodzaju (np. tekstu). Nowoczesne formaty pozwalają przechowywać dokumenty o niezwykle złożonej strukturze. Dokumentacja techniczna, czyli ścisły opis takich formatów, niezbędny twórcom programów, które je obsługują, często liczy setki stron. Bez odpowiedniego programu lub pozwalającej go stworzyć dokumentacji plik okazuje się bezużyteczny. Pomimo że fizycznie znajduje się na dysku komputera, nie da się wydobyć z niego informacji.

Cyfrowa amnezja

W roku 2001 uczeni z NASA postanowili ponownie przeanalizować część danych zarejestrowanych w roku 1976 na Marsie przez misję Viking. Okazało się wówczas, że wyniki pomiarów zapisano w nieudokumentowanym formacie, którego autorzy już umarli lub opuścili NASA. Szczęśliwie, zachowały się wydruki około jednej trzeciej danych. Większości, dostępnej tylko w nieznanym formacie, nie udało się już odzyskać.

Kluczową dla formatów sprawą okazuje się dostępność i warunki korzystania z ich dokumentacji. Format otwarty to taki, którego dokumentacja jest powszechnie dostępna i utrzymywana przez niezależną organizację, zaś użytkowanie nie podlega żadnym ograniczeniom. Takie podejście sprawia, że każdy programista może w razie potrzeby stworzyć aplikację obsługującą dany format. Jeśli nawet program, w którym dokument został przygotowany, przestanie być dostępny, nadal będzie się dało odzyskać zapisane dane.

Przeciwieństwo stanowi format zamknięty, nieposiadający publicznie dostępnej dokumentacji lub obwarowany ograniczeniami natury prawnej bądź technicznej, które uniemożliwiają jego swobodne wykorzystywanie. Zamknięte są także formaty o dostępnej publicznie specyfikacji, lecz w pełni kontrolowanej przez jedną firmę, która może w każdej chwili zmienić reguły gry.

W świecie informatyki szybkie zmiany to reguła, a nie wyjątek. Jeszcze kilkanaście lat temu na rynku edytorów tekstu królował WordPerfect. W Polsce popularny był również TAG, a wcześniej – WordStar i ChiWriter. Dziś mało kto pamięta o tych programach. Można się spodziewać, że wiele popularnych dziś rozwiązań czeka taki sam los. Nie chodzi tylko o to, że zaprzestaje się rozwijania starych aplikacji – nieustannie zmieniają się sprzęt i systemy operacyjne, na których po pewnym czasie nie da się już uruchomić dawnych programów. A nawet jeśli się to uda, nie będą one spełniały współczesnych standardów ergonomii i współpracy z innymi aplikacjami.

W pewnym momencie przejście na inny program stanie się zatem konieczne. Dane zapisane w zamkniętym formacie mogą się wtedy okazać niemożliwe lub bardzo trudne do odczytania. Otwarty format gwarantuje, że owo przejście będzie możliwe – zawsze można skorzystać z dokumentacji i napisać program obsługujący odpowiedni format.

Ryzyko cyfrowej amnezji dotyczy nie tylko informacji przechowywanych w naszych komputerach osobistych. Zagrożone są także bazy danych i archiwa zawierające informacje niezbędne do funkcjonowania przedsiębiorstw i państw. Nie są od niego wolne zapisane w postaci cyfrowej dobra kultury, np. promowane od pewnego czasu książki elektroniczne (e-booki), zdigitalizowane filmy ani – jak pokazało doświadczenie NASA – dane naukowe.

Dane jako zakładnik

Zasada otwartości może dotyczyć nie tylko formatów danych, lecz także standardów działania infrastruktury informatycznej – na przykład sposobu, w jaki komputery komunikują się przez sieć. Internet rozwinął się błyskawicznie m.in. dlatego, że jego działanie oparto na otwartych standardach komunikacji. Dzięki nim do globalnej sieci mógł się podłączyć każdy, bez względu na rodzaj używanego oprogramowania.

Tymczasem zamknięte formaty stosuje się często, by wymusić na klientach zakup kolejnych wersji konkretnego programu oraz uniemożliwić przejście na rozwiązania konkurencji. Gdy dominujący na rynku program używa zamkniętego formatu danych, konkurencja musi nie tylko stworzyć dobry program alternatywny, ale także sprawić, by obsługiwał zamknięty format plików używany przez lidera rynku. Bez tego użytkownicy po alternatywę nie sięgną. Obsługa zamkniętego formatu oznacza jednak ogromne nakłady dodatkowej pracy, która często i tak nie daje zadowalających efektów. Może też zostać zablokowana – np. w USA dopuszczalne jest patentowanie algorytmów komputerowych. Ostatecznie może się okazać, że nawet jeśli dominujący program jest gorszy od alternatywnego, przejście na alternatywny jest tak kłopotliwe, że w krótkiej perspektywie nieopłacalne. Mówi się wówczas o tzw. vendor lock-in, czyli „zamknięciu” użytkownika w kręgu wytworów jednego producenta. W negocjacjach z dostawcą oprogramowania dane użytkownika stają się zakładnikiem.

Vendor lock-in lub utrata dostępu do historycznych danych mogą się okazać bolesne zarówno dla indywidualnego użytkownika, jak i dla firmy. Szczególna odpowiedzialność ciąży jednak na instytucjach publicznych, ponieważ na współpracę z nimi skazani są bez wyjątku wszyscy obywatele. Jeżeli państwo korzysta z zamkniętych standardów, tym samym zmusza miliony osób do korzystania z rozwiązań producenta, który był na tyle zaradny, by przeforsować używanie własnego systemu w tak strategicznym miejscu. Ograniczone są również wszelkie formy społecznej kontroli nad tak zapisanymi danymi. Neutralność technologiczna państwa jest dla społeczeństwa tym samym na płaszczyźnie technicznej, czym demokracja – na politycznej. Dostęp do informacji i publicznych zasobów informatycznych muszą mieć wszyscy, niezależnie od producenta używanych technologii, podobnie jak demokracja daje szansę na prezentowanie różnorodnych poglądów politycznych.

Państwo zmusza do Windowsa

Niestety, zmuszanie obywateli do korzystania z zamkniętych standardów jest nader powszechne. Wiele instytucji państwowych udostępnia w swoich serwisach internetowych dokumenty przeznaczone do druku tylko w zamkniętym formacie Microsoft Worda, najpopularniejszego obecnie edytora tekstu. Dotyczy to także danych publikowanych obowiązkowo w Biuletynach Informacji Publicznej (BIP). Część państwowych uczelni wymaga składania prac magisterskich w formacie Worda. Materiały filmowe udostępniane w internecie przez Telewizję Polską są zapisane w zamkniętych formatach, np. Windows Media, co może utrudniać lub uniemożliwiać ich odtwarzanie użytkownikom innych niż Windows systemów operacyjnych.

O tym, jak silny jest vendor lock-in w naszych instytucjach państwowych, można się przekonać, czytając zamówienia publiczne dotyczące oprogramowania: jako przedmiot przetargu często podawany jest konkretny producent i nazwa programu.

Przykłady można mnożyć. Przepisy nakładają na firmy zatrudniające powyżej pięciu osób obowiązek rozliczania się z ZUS drogą elektroniczną. Udostępniono w tym celu program o nazwie Płatnik, który współpracuje wyłącznie z systemami z rodziny Windows. Grupa użytkowników innych systemów operacyjnych (m.in. Linux i Mac OS) zwróciła się do ZUS z prośbą o udostępnienie dokumentacji tzw. protokołu KSI MAIL, za pomocą którego program Płatnik komunikuje się z serwerami ZUS. Pozwoliłoby to stworzyć program działający pod ich systemami.

Wniosek został odrzucony. Dopiero sąd zmusił ZUS do udostępnienia tej dokumentacji – stwierdził, że format wymiany danych z ZUS stanowi informację publiczną i nie może być utajniony. Długotrwały proces i utrudnienia ze strony ZUS sprawiły jednak, że pomimo sukcesu w sądzie i zainteresowania mediów budowa alternatywnego dla Płatnika programu (pod nazwą Janosik) praktycznie się zatrzymała.

***

Alternatywę dla zamkniętych formatów MS Office stanowi format OpenDocument – otwarty standard dokumentów biurowych zatwierdzony przez ISO (Międzynarodową Organizację Normalizacyjną). Powoli zyskuje on na popularności, choć nadal jeszcze wiele osób wpada w panikę, otrzymawszy plik o rozszerzeniu „.odt”. OpenDocument jest używany jako podstawowy format w kilku bezpłatnych, dostępnych w sieci programach typu open source, takich jak OpenOffice i KOffice. Obsługują go także (jako format dodatkowy, który trzeba specjalnie wybrać) nowsze wersje MS Office. Niestety, obsługa w MS Office pozostawia na razie wiele do życzenia.

Komisja Europejska uwzględniła otwarte standardy w Europejskich Ramach Interoperacyjności (EIF). Pracom nad nową wersją tej unijnej rekomendacji towarzyszą jednak intensywne działania lobbystów, którzy chcą rozmycia definicji otwartych standardów oraz osłabienia zapisów promujących ich stosowanie. W Polsce do pojęcia neutralności technologicznej odwołuje się tzw. ustawa o informatyzacji, ale definiuje ją bardzo wąsko i nie odnosi się do pojęcia otwartych standardów. W rozporządzeniu Rady Ministrów w sprawie minimalnych wymagań dla systemów teleinformatycznych wspomniano o formacie OpenDocument, ale wymieniono tam także wiele formatów zamkniętych.

Droga do pełnej neutralności technologicznej państwa jest jeszcze daleka. Jej osiągnięcie leży w najlepszym interesie nas wszystkich.

Odnośniki

Historia zmian


From the homepage of Michał Kosmulski, http://michal.kosmulski.org/
Unless indicated otherwise, all content © 2004-2016 Michał Kosmulski. All rights reserved.