Cyfrowe dziedzictwo kulturowe

Cyfrowe dziedzictwo kulturowe

Rok 2023 przyniósł wiele ciekawych rozwiązań w obszarze bibliotek cyfrowych i agregacji cyfrowych danych dziedzictwa kulturowego. Prace nad rozwojem pakietu oprogramowania DInGO, we współpracy z Biblioteką Śląską oraz Uniwersytetem Wrocławskim, zaowocowały pierwszymi wdrożeniami siódmej generacji systemu dLibra, wyróżniającej się nowym układem interfejsu użytkownika, zmienionym sposobem przeszukiwania zasobów udostępnianych w systemie oraz ich prezentacji z uwzględnieniem występowania poszukiwanych fraz w treści obiektu.

Według użytkowników jest to przełomowa zmiana w trybie dostępu i pracy z zasobami cyfrowymi dziedzictwa kulturowego, która pozwala na sprawne poruszanie się w treści obiektów cyfrowych. Dalszy rozwój systemu WLT (Wirtualne Laboratorium Transkrypcji) zaowocował wdrożeniem nowej wersji TransLab Uniwersytetu Wrocławskiego oraz modułu rozpoznawania tekstów historycznych śląskiego agregatora Ariadna. Narzędzia te pozwalają tworzyć cyfrowy tekst na podstawie skanów, a wyniki tej pracy można wykorzystać do przygotowania obiektu cyfrowego w takich standardach jak: hOCR, TEI, PDF, czy eBook. Platformy te pozwalają na transkrypcję obiektów dodanych do serwisu z własnego urządzenia lub importowanych z istniejących bibliotek cyfrowych, także z wykorzystaniem standardu IIIF.

W 2023 roku odsłoniliśmy również nową wersję platformy Federacji Bibliotek Cyfrowych (FBC), będącą rezultatem prac w projekcie FBC TeNe. W nowej platformie FBC zindeksowaliśmy już ponad 3,7 mln obiektów i sukcesywnie pozyskujemy rekordy z największych polskich bibliotek i repozytoriów,
takich jak Repozytorium Cyfrowe Instytutów Naukowych lub Wielkopolska Biblioteka Cyfrowa. Nowa odsłona FBC daje niedostępne dotąd możliwości wyszukiwania, tj. łączy mechanizmy wyszukiwania po metadanych z przeszukiwaniem treści. Wykorzystywane w tym kontekście technologie pozyskiwania treści zawierają m.in mechanizmy optycznego rozpoznawania znaków OCR i optycznego rozpoznawania zapisu nutowego OMR, które wydobywają zawartość plików, wzbogacają obiekty dostępne poprzez FBC i zwiększają dostępność zeskanowanych obiektów, książek, czasopism, a także nut!

Dane do nowego FBC dostarczane są dzięki stworzonemu przez zespół PCSS narzędziu DACE (Data Aggregation and proCessing Engine). Działa on w oparciu o mikroserwisy i przepływ zdarzeń/wiadomości. Jego architektura pozwala na dostosowywanie przepływu pracy agregatora w zależności od scenariusza agregacji, konsolidacji czy wzbogacania danych. Dlatego też z powodzeniem jest używany nie tylko w FBC, lecz także w dwóch agregatorach lokalnych w Polsce oraz w ramach SSH Open Marketplace – europejskiej platformy agregującej zasoby nauk społecznych i humanistycznych, będącej częścią EOSC.

Tomasz Parkoła
Kierownik Działu Bibliotek Cyfrowych i Platform Wiedzy, PCSS
Aleksandra Nowak
Lider Zespołu ds. Agregacji Danych, PCSS
Błażej Betański
Dział Bibliotek Cyfrowych, PCSS