Pierwsze spotkanie projektu KMD4EOSC

Pierwsze spotkanie projektu KMD4EOSC

Przez dwa dni, 14 i 15 maja 2025 r., w siedzibie PCSS gościli uczestnicy pierwszego spotkania projektu KMD4EOSC – Uniwersalna infrastruktura dla składowania i udostępniania danych oraz efektywnego przetwarzania dużych wolumenów danych w modelach HPC, BigData i sztucznej inteligencji. Spotkanie było okazją do wymiany doświadczeń dla całego zespołu projektowego, liczącego blisko 90 osób, zrzeszonych w ramach konsorcjum złożonego z 11 jednostek​.

W skład konsorcjum wchodzą:

1. Instytut Chemii Bioorganicznej Polskiej Akademii Nauk – Poznańskie Centrum Superkomputerowo-Sieciowe
2. Politechnika Gdańska CI TASK
3. Politechnika Wrocławska – Wrocławskie Centrum Sieciowo-Superkomputerowe
4. Narodowe Centrum Badań Jądrowych
5. Akademickie Centrum Komputerowe CYFRONET AGH
6. Politechnika Częstochowska
7. Politechnika Świętokrzyska
8. Politechnika Białostocka
9. Politechnika Łódzka
10. Uniwersytet Warszawski
11. Uniwersytet Zielonogórski

Dyskusje i prezentacje dotyczyły zadań realizowanych w ramach czterech laboratoriów:

· Laboratorium 1: elementy funkcjonalne, komponenty usług i infrastruktury realizujące zarządzanie danymi ich przechowywanie i dostęp oraz mechanizmy zapewniające wydajność dostępu do danych, ich przetwarzania a także bezpieczeństwo i niezawodność przechowywania i dostępu do danych,
· Laboratorium 2: mechanizmy zapewniające odpowiednie zarządzanie danymi na poziomie logicznym w tym przechowywanie danych zorganizowanych w repozytoria, przetwarzanie, agregowanie i przeszukiwanie meta-danych; aktywności rozwiązania techniczne zapewniające dostosowanie repozytoriów i agregatorów meta-danych i wyszukiwarek do wymagań otwartej nauki (KE, MNiSW),
· Laboratorium 3: mechanizmy trwałości, w tym mechanizmy techniczne oraz organizacyjne umożliwiające zapewnienie trwałości na poziomie projektu architektury, otwartości interfejsów, doboru technologii a także na poziomie procedur zarządzania systemem i usługami w tym monitoringu, wykrywania i reakcji na błędy i powiązanych mechanizmów wsparcia oraz audytów bezpieczeństwa),
· Laboratorium 4: mechanizmy dostępu do danych przez różne interfejsy – od interfejsów i organizacji dostępu w modelu Data lake/Data Mesh do elementów pozwalających na analizę i przetwarzanie danych gromadzonych w repozytoriach z wykorzystaniem modeli AI, a także usług pozwalających na zaawansowane, kontekstowe wyszukiwanie danych z wykorzystaniem dużych modeli językowych.

W trakcie drugiego dnia spotkania zaprezentowane zostały doświadczenia partnerów w obszarach budowy modeli LLM wykorzystywanych w sztucznej inteligencji AI.

KMD to również otwarta nauka znana pod hasłem EOSC (European Open Science Cloud) czyli polityka Komisji Europejskiej udostępnienia danych i informacji przez naukę i na rzecz nauki, gospodarki oraz społeczeństwa. EOSC to repozytoria dużych ilości danych wraz inteligentnymi metodami przeszukiwania danych w celu wyodrębnienia informacji i pozyskania wiedzy (AI) oraz katalogiem otwartych usług dostępnych dla każdego. KMD zamieszczony został w polityce Ministerstwo Nauki i Szkolnictwa Wyższego jako platforma, która zrealizuje zasady otwartej nauki w Polsce.

Projekt FENG.02.04-IP.04-0015/24 Krajowy Magazyn Danych. Uniwersalna infrastruktura dla składowania i udostępniania danych oraz efektywnego przetwarzania dużych wolumenów danych w modelach HPC, BigData i sztucznej inteligencji (KMD4EOSC) współfinansowany jest ze środków Funduszy Europejskich dla Nowoczesnej Gospodarki w Polsce w latach 2021-2027.