2015-03-23 10:45 GMT+01:00 rysiek rysiek@hackerspace.pl:
Cześć,
mam zagwozdkę: słyszałem, że na stadionach w Stanach jest stosowana technologia polegająca na używaniu dziesiątek czy setek mikrofonów, po czym wyciąganiu audio konkretnych osób an trybunach za pomocą łączenia i filtrowania audio z kilku/kilkunastu mikrofonów najbliżej tej osoby/osób.
Zastanawiam się, czy nie dałoby się tego użyć do wyciągnięcia znośnego audio z kilku-kilkunastu słabych nagrań tego samego wydarzenia (np. przedstawienia teatralnego).
Tak, pod pewnymi warunkami, i jest to dość złożone DSP.
Niekoniecznie chodzi mi o gotowy skrypt/software, nawet info, czy i jak to zrobić ręcznie za pomocą Audacity czy inszego general purpose audio softu.
Niestety, nie ma dobrych gotowców do beamformingu i wielokanałowego odszumiania. Zna się na tym może kilkaset osób na świecie. Pracowałem nad takim systemem i niestety niewiele mogę ci poradzić, because proprietary reasons. Nie jest to proste, nawet dla tak ograniczonego wejścia jak mowa.
Może coś wyniknęło z projektów EU - ale pewnie też zamknięte i proprietary.
Ktoś coś?
Słowa kluczowe: adaptive beamforming; multichannel voice enhancement; dereverberation. Konferencja ICASSP. Więcej nazwisk i autorów tam znajdziesz.