| Guests | 38 |
| Members | 6 |
- Janusz | |
- jolka | |
- Milksurfer | |
- piesta | |
| Total | 44 |
12 kwietnia 2008 roku w Muzeum Miasta Gdyni odbyło się II seminarium Genealogiczne, podczas którego Wojciech Beszczyński opowiedział zebranym o akcji digitalizacji i indeksowania ksiąg metrykalnych podjętej przez Pomorskie Towarzystwo Genealogiczne.
1. Cele digitalizacji zasobów ksiąg metrykalnych
Pod pojęciem digitalizacji – w odniesieniu do bibliotek i archiwów, rozumiemy wprowadzanie tradycyjnych, drukowanych lub rękopiśmiennych materiałów i dokumentów w postaci cyfrowej do pamięci komputerów.
Do głównych celów digitalizacji zaliczamy :
Archiwizację – zgromadzenie w cyfrowych pamięciach komputerów książek i materiałów, występujących dotąd w tradycyjnej, papierowej (pergaminowej, płóciennej) postaci.
Tworzone są w ten sposób kopie (bezpieczeństwa) archiwalnych materiałów o bezcennej nieraz wartości historycznej, dając możliwość odtworzenia oryginałów w przypadku ich zniszczenia w wyniku katastrof żywiołowych – powodzi, pożaru.
Umożliwia to także łatwe powielanie (kopiowanie) materiałów w praktycznie nieograniczonej liczbie egzemplarzy przy stosunkowo niewysokich kosztach. Tymi kosztami są ceny nośników pamięci (płyty CD i DVD o olbrzymiej pojemności, tzw. PenDrive – pamięci USB) lub cena eksploatacji drukarek – papieru i atramentu (tonera). Dzisiaj jedynymi praktyczne ograniczeniami w powielaniu zdigitalizowanych materiałów są prawa autorskie, inne przepisy – na przykład „Ustawa o ochronie danych osobowych” oraz polityka udostępniania zasobów cyfrowych realizowana przez ich dysponenta.
Także istotną sprawa jest łatwość przesyłania zdigitalizowanych materiałów. W obecnym stadium rozwoju Internetu nie stanowi problemu przesłanie wybranemu odbiorcy dowolnych pozycji archiwalnych, byleby tylko były one w postaci cyfrowej.
Ochronę oryginałów - poprzez ograniczenie konieczności bezpośredniego obcowania czytelnika z dokumentem pierwotnym, eliminację zmian warunków przebywania dokumentów: magazyn – czytelnia, wielokrotnego wertowania ksiąg, likwidację zdarzających się archiwach aktów kradzieży czy wandalizmu w postaci wyrywania stron lub też fragmentów dokumentów.
Ewidencję zasobów - digitalizowane książki i dokumenty przechowywane są w pamięci komputerów w postaci oddzielnych plików. Ze względu na wciąż rosnącą ich liczbę byłyby one praktycznie bezużyteczne, gdyby nie stworzono systemu szybkiego (błyskawicznego) lokalizowania umiejscowienia pliku w pamięci komputera. Tak jak trudno sobie wyobrazić tradycyjna bibliotekę bez katalogu (alfabetycznego, rzeczowego). Ponieważ w informatyce pojęcie „katalog” ma nieco inne znaczenie, przy digitalizacji odpowiednikiem tradycyjnego katalogu bibliotecznego czy też inwentarza archiwalnego jest baza danych. Jest zbiór danych oraz program komputerowy wyspecjalizowany w do gromadzenia i przetwarzania danych.
Nie wdając się w szczegółowe opisy różnego rodzaju baz danych i programów nimi zarządzających możemy powiedzieć, że w naszych działaniach stosujemy głównie kartotekowe bazy danych. Są to tablice (wykazy), w których w poszczególnych kolumnach i wierszach zapisano informacje istotne z punktu widzenia celu, dla którego zostały one stworzone. Technologie tworzenia tych baz oraz sposób powiązania ich z istniejącymi zasobami zdigitalizowanych materiałów zostanie omówiony w dalszej części wykładu.
Opisane powyżej działanie – tworzenie bazy danych – przyjęliśmy w naszym genealogicznym środowisku nazywać skrótowo indeksowaniem, jakkolwiek w terminologii informatycznej to słowo ma węższe znaczenie i oznacza tworzenie indeksu (numeru elementu tablicy, w którym znajduje się indeksowany element będący jej treścią), umożliwiającego obniżenie czasu dostępu do danych.
Przeglądanie i udostępnianie - przeglądanie zdigitalizowanych książek i dokumentów z reguły odbywa się przy pomocy graficznych programów komputerowych. Mogą to być programy uniwersalne –na przykład wchodzący w skład pakietu Microsoft Office Microsoft Office Picture Manager lub bardziej wyspecjalizowane, tak jak obecnie używany w większości bibliotek cyfrowych program DjVu, stanowiący odmianę popularnego Acrobat Readera.
Komputerowa baza danych, zawierającej informacje o zdigitalizowanych materiałach wraz z programem umożliwiający jej przeszukiwanie pozwala na szybkie odnalezienie potrzebnych informacji. Wykorzystuje się do tego celu różne wyszukiwarki i filtry, przy czym technika posługiwania się nimi coraz bardziej się upraszcza. Obecnie wystarcza w okienko „Wyszukiwacza” wpisać poszukiwane słowo (lub kilka słów w jedno lub kilka okienek) i kliknąć na ekranie [szukaj], aby po chwili wyświetliła się na ekranie lista znalezionych elementów – lub komunikat o braku takowych.
Stopień udostępnienia baz danych z możliwością ich przeszukiwania i przeglądania zdigitalizowanych dokumentów jest określone przez dysponenta takich baz i stopień rozbudowania samej bazy danych. Mogą one być umieszczone w pamięci komputera i tylko jego użytkownik ma do niego dostęp {bazy danych poległych żołnierzy – tylko na moim komputerze}, mogą być dostępne w czytelni komputerowej, w której poszczególne stacje podłączone są do wspólnego serwera, ale nie ma dostępu do danych poza czytelnią (Archiwum Diecezjalne, czytelnie bibliotek szkół wyższych) oraz powszechnie dostępne poprzez sieć Internetu. Dostępność poprzez Internet może być nieograniczona – każdy, kto wejdzie na stronę Internetową ma dostęp do bazy, nieraz wymagana jest rejestracja na stronie, a w niektórych przypadkach dostęp posiadają tylko zarejestrowani i zatwierdzeni przez administratora strony użytkownicy (strony bibliotek szkól wyższych).
2. Digitalizacja i indeksacja w PTG
Digitalizacja i indeksacja informacji genealogicznych ( nie tylko ksiąg metrykalnych) stanowi jeden z głównych elementów działalności Pomorskiego Towarzystwa Genealogicznego od chwili jego powstania. Niektórzy z jego członków zajmowali się tym jeszcze przed zawiązaniem Towarzystwa, będąc prekursorami tworzenia dzisiaj już bardzo rozbudowanej bazy danych genealogicznych, dostępnych na wielu stronach internetowych.
Pierwszy prezes naszego Towarzystwa, dzisiaj jego członek honorowy Stanisław Pieniążek opracował bazę danych znaną jako "Katalog zasobów metrykalnych", dostępną na stronie internetowej Polskiego Towarzystwa Genealogicznego (Pom.TG jest członkiem wspierającym tego towarzystwa) www.genealodzy.pl. Baza ta zawiera dane teleadresowe ponad 10 tysięcy parafii z uwzględnieniem danych o zasobach metrykalnych.
Kolejnym elementem archiwizacji i indeksacji związanych z genealogią jest dostępna na stronie internetowej PomTG baza cmentarzy.
Od ponad dwóch lat gromadzimy w niej zdjęcia, plany cmentarzy oraz nazwiska pochowanych na nich osób. Są to pomorskie cmentarze historyczne oraz wojenne (w tym także cmentarze Armii Czerwonej). Ta baza danych pozwala na określenie położenia geograficznego cmentarza, zawiera listę osób pochowanych oraz (jeszcze nie dla wszystkich cmentarzy) fotografie nagrobków, pojawiające się po kliknięciu na numer grobu na liście.
3. Digitalizacja i indeksowanie ksiąg metrykalnych
Digitalizacja
Przetwarzanie ksiąg metrykalnych (jak również wszelkich innych dokumentów) w postać cyfrową obecnie realizuje się dwiema metodami:
- przez skanowanie
- przez fotografowanie cyfrowe
Literatura przedmiotu wymieniała jeszcze niedawno trzecią metodę:
- mikrofilmowanie i następnie skanowanie mikrofilmów, jednakże stosowana jest ona obecnie tylko w stosunku do istniejących zasobów mikrofilmów, zgromadzonych w archiwach i bibliotekach.
Istotą działania skanera jest przebiegowa rejestracja obrazu, głowica skanera rejestruje kolejne linie obrazu, przesuwając się nad nim (lub obraz przesuwa się względem głowicy). Jeszcze niedawno skanowanie wymagał ułożenie i dociśnięcie skanowanego obrazu (strony skanowanej księgi) do szklanej płyty urządzenia, co nie było zbyt korzystne dla kondycji ksiąg i innych wielostronicowych dokumentów. Głowica optyczna takiego skanera ma bardzo mała głębię ostrości, fragmenty obrazu odstające od płyty są niewyraźne lub w ogóle nieczytelne.
Obecnie skanery osiągnęły zupełnie nowy stopień rozwoju.
Są to urządzenia umożliwiające rejestrację obrazu przez głowice optyczną znajdująca się w pewnej odległości od skanowanej ksiązki lub dokumentu.
Pracują one z dużą szybkością (skanowanie strony formatu A3 z rozdzielczością 600 dpi trwa 1,5 – 2 sekundy), wbudowane oprogramowanie pozwala na „wyprostowanie” skanowanego tekstu, eliminując konieczność spłaszczania otwartej księgi, co nie jest bez znaczenie dla jej stanu, automatycznie orientują ułożony na stole dokument, rozpoznają strony i zmniejszają marginesy.
Niektóre są już wyposażone w pedały, pozwalając użytkownikowi na swobodne operowanie obiema rękami.
Cena tych skanerów jest jeszcze dość wysoka, dlatego stosują je duże biblioteki, takie jak np. Kujawsko-Pomorska Biblioteka Cyfrowa lub Wielkopolska Biblioteka Cyfrowa, które co tydzień informują o powiększeniu dostępnych zdigitalizowanych zasobów o kilkadziesiąt pozycji, wśród których jest wiele bardzo cennych dla genealogów.
W Pomorskim Towarzystwie Genealogicznym stosujemy fotografię cyfrową do digitalizacji ksiąg metrykalne, stanowiących zasoby Archiwum Diecezjalnego w Pelplinie, jak również znajdujących się w parafiach na terenie kraju. Wyspecjalizowało się w tej technice kilku naszych kolegów, jednym z nich jest Leszek Ćwikliński, wiodący fotograf naszego towarzystwa.
Stosuje on w tym celu prosty zestaw, pokazany na fotografii:
Na zdjęciu brak jest samego fotografa oraz jego pomocnika, który przekłada w sporym tempie karty księgi.
Jedno z comiesięcznych spotkań naszego towarzystwa było poświęcone zapoznaniu członków z techniką fotografowania ksiąg. Pan Leszek Ćwikliński opowiadał o swych doświadczeniach oraz stosowanym przez niego sprzęcie.
Po sfotografowaniu księgi metrykalnej poszczególne zdjęcia są opisywane i przegrywane z pamięci aparatu na płyty CD. Jedna kopia pozostaje w Archiwum, druga przekazywana jest PTG.
Na płycie CD znajdują się cyfrowe zdjęcia kolejnych stron księgi metrykalnej – chrztów, ślubów lub zgonów. Na zdjęciu widocznym na ekranie jest fragment księgi ślubów z parafii Św.Mateusza w Starogardzie Gdańskim z początku 1832 roku.
Indeksowanie
Koordynacją całej akcji indeksowania ksiąg metrykalnych zajmuje się wyznaczony członek naszego towarzystwa. Obecnie jest nim pani Wisława Walder. Przekazuje ona woluntariuszom, członkom PTG podejmującym się indeksacji danej parafii płytę CD za pokwitowaniem, które zawiera między innymi zobowiązanie do nie kopiowania i udostępniania zawartości płyty innym osobom. Należy bowiem mieć na uwadze, że właścicielem i dysponentem ksiąg metrykalnych, także w postaci cyfrowej, jest Archiwum Diecezjalne w Pelplinie.
Indeksacja polega na odczytywaniu kolejnych zapisów z księgi metrykalnej i wpisywaniu ich na wykaz stworzony w arkuszu kalkulacyjnym – EXCEL-u.
Przyjęliśmy zasadę, że wszystkie nazwy osobowe są wpisywane w oryginalnej wersji, bez spolszczeń imion, w takiej postaci tak jak to czynili księża dokonujący wpisów w księgach metrykalnych.
W taki sposób przygotowane tabele są przekazywane (przeważnie drogą elektroniczną) koordynatorowi projektu oraz administratorowi strony internetowej naszego Towarzystwa, którą to funkcję pełni obecny nasz prezes, pan Adam Kamiński.
Baza danych
Opracowane przez członków PTG tabele są transformowane do bazy danych, udostępnianej na stronie internetowej Towarzystwa. Dostęp do tej bazy jest możliwy ze strony głównej poprzez uaktywnienie w menu przycisku „Baza danych”. Jest ona dostępna bez ograniczeń, rejestracja na stronie nie jest wymagana. Po wybraniu jednego z indeksów – chrztów, ślubów lub zgonów wchodzi się w okno wyszukiwarki.
W zależności od tego, który z parametrów wybierzemy za klucz wyszukiwania, otrzymujemy odpowiednią listę wyników.
W bazie danych PTG zastosowano rozwinięte metody wyszukiwania, pozwalające na odnalezienie nie tylko nazwisk w wersji wpisanej, ale także podobnie brzmiących. Ma to bardzo istotne znaczenie przy wyszukiwaniu różnych wersji i pisowni nazwiska, które się zmieniały z upływem lat, a także były wynikiem bardzo nieraz różnorodnej interpretacji zasad ortografii jak również zwykłych błędów przez kolejnych popełnianych prowadzących księgi metrykalne.
Na formularzu wyszukiwarki są do wyboru trzy metody wyszukiwania:
- szukanie dosłowne
- metoda Soundex
- metoda Daitch-Mokotoff Soundex
Pierwsza metoda nie wymaga szerszego przedstawiania, druga i trzecia polega na kodowaniu nazwiska według specjalnego algorytmu. Dokładny opis tych metod odnaleźć można w artykule Adama Kamińskiego.
Baza danych dostępna na stronie internetowej Towarzystwa nie jest bezpośrednio powiązana z zasobami zdigitalizowanych ksiąg i nie pozwala (na razie) na wyświetlenie na ekranie komputera oryginalnej strony księgi metrykalnej, zawierającej odnaleziony zapis. Pozwala jedynie na stwierdzenie, że poszukiwany wpis znajduje się w zasobach Archiwum Diecezjalnego w Pelplinie.
Tego rodzaju informacje noszą w informatyce nazwę „meta dane”. Żeby otrzymać pełną kopię wpisu, zawierająca dodatkowe informacje – nazwiska chrzestnych, nazwiska świadków ślubu, przyczynę zgonu - należy obecnie udać się do czytelni Archiwum.
Czytelnia jest skomputeryzowana, a opracowana w Towarzystwie baza danych jest sukcesywnie przekazywana na serwer Archiwum, na którym są także zdigitalizowane przez naszych członków księgi metrykalne (jak również inne dokumenty, na przykład księgi wizytacji).
Czytelnia komputerowa Archiwum Diecezjalnego w Pelplinie powstała przy wydatnym udziale Pomorskiego PTG, które wyposażyło sieć komputerową w kilka stanowisk oraz zakupiło twardy dysk dużej pojemności. Uroczyste otwarcie czytelni komputerowej odbyło się w maju zeszłego roku.
Korzyści płynące z indeksacji zasobów metrykalnych
Realizacja projektu archiwizacji i digitalizacji zasobów metrykalnych, oprócz korzyści wymienionych na wstępie wykładu, ma również szereg innych, niewymiernych zalet.
W mojej opinii ważną zaletą udziału w tym przedsięwzięciu jest nabywanie doświadczenia w odczytywaniu rękopiśmiennych zapisów, które na przestrzeni kilku wieków były wykonywane w języku polskim, niemieckim (na naszych terenach) i po łacinie. Wpisy nie zawsze były dokonywane z należytą starannością, osoby je realizujące w różnym stopniu miały opanowane nawyki kaligrafii. Do tego dochodzi specyficzny krój pisma niemieckiego, stosowany w niektórych okresach.
Wyniesiona z indeksacji ksiąg metrykalnych umiejętność czytania starych zapisów stanowi wielką pomoc w indywidualnych poszukiwaniach genealogicznych. Autor tych słów przekonuje się o tym osobiście, mając swój udział w postaci 35 tysięcy odczytanych i wpisanych do bazy danych zapisów metrykalnych z jednej tylko parafii w Starogardzie Gdańskim.
Kolejną zaletą indeksacji jest możliwość wykorzystywania bazy danych do innych opracowań o charakterze historyczno-socjologicznym, Można tutaj wymienić na przykład informacje o częstotliwości występowania imion w minionym okresie.
Swego czasu na forach genealogicznych prowadzono dyskusję o umieralności dzieci w minionych stuleciach. Została ona wywołana przez osoby, które przy kwerendach w księgach zgonów napotykały liczne informacje o zgonach dzieci, nie potrafiły natomiast określić skali tego zjawiska.
Indeksacja zgonów parafii w Starogardzie Gdańskim nasunęła mi pomysł statystycznego opracowania danych, dotyczących wieku umierania członków tej społeczności. Dziesięć tysięcy wpisów w księgach zgonów na przestrzeni prawie całego XIX wieku stworzyło zbiór, pozwalający na dokonanie pewnych, statystycznych uogólnień. Oczywiście mają one ograniczony terytorialnie i czasowo zasięg, jednakże z dużym prawdopodobieństwem można je odnieść do innych terenów kraju w tym samym okresie.
Wyniki tej analizy zostały zaprezentowane w artykule Jak długo żyli ludzie w XIX wieku.
Jeden z wykresów umieszczonych w wspominanym artykule pokazano na kolejnym slajdzie. Wynika z niego, że udział zgonów dzieci w wieku do czterech lat w ogólnej liczbie zgonów rósł na przestrzeni XIX wieku od 40% do 60% ogólnej liczby zgonów.
Dla informacji podam tylko, że w dzisiejszych czasach ten udział wynosi około jednego procenta.
Innym wnioskiem, który można było wysnuć z analizy wieku umierania, było zmniejszanie przeciętnej długości życia społeczności Starogardu Gdańskiego z 25 lat na początku XIX wieku do 19 lat na przełomie XIX i XX wieku. Oczywiście ten wskaźnik jest związany z umieralnością dzieci, ale tego typu dane, otrzymane niejako na marginesie indeksowania ksiąg metrykalnych, mogą stanowić materiał do opracowań historyczno-socjologicznych, wykonywanych przez profesjonalistów w tych dziedzinach.
Widziałem swego czasu podobną dysertację doktorską, opartą na dużo mniejszym zbiorze danych, z tym, że zawierająca także analizę przyczyn zgonów.
Bazy danych dostępne na innych stronach internetowych
Pomorskie Towarzystwo Genealogiczne nie jest jedynym, które tworzy i udostępnia bazy danych genealogicznych na swojej stronie internetowej. Polskie Towarzystwo Genealogiczne prezentuje na swej stronie internetowej tak zwana Genetekę.
Jednym z najstarszych projektów indeksowania bazy małżeństw jest prywatna strona internetowa, poświęcona Prowincji Poznańskiej w XIX wieku.
Poszerza się wciąż dostępny w Internecie zasób informacji genealogicznych, nie związany bezpośrednio z indeksacją ksiąg metrykalnych. Można tutaj jako przykład wymienić bazę danych poległych w czasie I Wojny Światowej, tworzoną na podstawie inskrypcji na nagrobkach i pomnikach, dostępną na stronie internetowej Polskiego Towarzystwa genealogicznego. Są tam także spisy żołnierzy WP w latach 1918-1920 oraz straty WP w tychże latach.
Na zakończenie chciałbym jeszcze wspomnieć o dostępnych na zagranicznych stronach internetowych listach Polaków. Są to między innymi publikowane na stronach rosyjskich wykazy zesłańców po Powstaniu Styczniowym lub też listy osób represjonowanych i deportowanych w okresie stalinowskim.