Laboratorium Technologii Interfejsów Głosowych

Laboratorium Technologii Interfejsów Głosowych dla Usług Nowej Generacji funkcjonuje przy Dziale Nowych Interfejsów Użytkownika, należącym do Pionu Usług Sieciowych PCSS-u. Jest to specjalnie zaprojektowane, wyciszone i klimatyzowane pomieszczenie o kontrolowanych parametrach akustycznych (możliwość regulacji czasu pogłosu T60 od 0,4 s do około 2 s).

Wyposażono je w profesjonalny sprzęt do utrwalania i obróbki sygnału mowy, a także w stanowiska do anotacji nagrań mowy, tekstów i obrazów. Stanowi ono tym samym idealne miejsce do rejestracji podkastów, audiobooków, głosów lektorskich czy wytwarzania danych dla systemów uczenia maszynowego. Nadaje się również do realizacji innych, mniej typowych przedsięwzięć, np. do prowadzenia ćwiczeń logopedycznych i oratorskich.

Kompetencje multidyscyplinarnego personelu Laboratorium, współtworzonego przez specjalistów z dziedziny akustyki, lingwistyki komputerowej i językoznawstwa, od lat zaangażowanych w prace nad przetwarzania sygnału mowy, zwłaszcza na potrzeby ASR, obejmują nie tylko samą rejestrację dźwięku i postprodukcję, lecz także np. wszechstronną eksploracją i znakowanie danych w postaci materiałów multimedialnych.

W Laboratorium wykorzystywany jest wysokiej klasy sprzęt audio-wideo: interfejsy, DAC-i, konwertery, mikrofony różnego typu (w tym sztuczna głowa Neuman KU100 do nagrań binauralnych), liczne urządzenia odsłuchowe i kontrolery dyktowania. Stosowane jest też specjalistyczne oprogramowanie związane z dziedziną ASR i inżynierią dźwięku.

Tylko w ostatnim okresie zasoby Laboratorium służyły realizacji takich m.in. projektów, jak: DARIAH-PL, EMMA44 czy RCMC. Jest ono ponadto miejscem prowadzenia regularnej działalności popularnonaukowej przez pracowników Działu Nowych Interfejsów Użytkownika.

Centrum Badawcze Polskiego Internetu Optycznego, 1.23B
Jana Pawła II 10, Poznań

Kontakt

Zapraszamy do skorzystania z naszej infrastruktury albo nawiązania współpracy w ramach poszczególnych laboratoriów.