IX TELEKOMUNIKACIONI FORUM TELFOR'2001, Beograd, 20-22.11.2001.god. MERENJE VREMENA REVERBERACIJE PRIMENOM DISKRETNE WAVELET TRANSFORMACIJE Igor Nikoliæ Institut Mihajlo Pupin, Beograd I UVOD U najveæem broju danas korišæenih algoritama za merenje vremena reverberacije anvelopa energije impulsnog odziva u datom opsegu uèestanosti se dobijaja propuštanjem impulsnog odziva kroz banku filtara nad èijim kvadriranim izlazima se vrši usrednjavanje. Meðutim, na ovaj naèin se ne dobija egzaktna vrednost anvelope veæ njena aproksimacija. Takoðe, frekvencijska rezolucija anvelope zavisi od propusnih opsega filtara u banci. Egzaktnu anvelopu moguæe je dobiti usrednjavanjem nivoa impulsng odziva po ansamblu. Schroeder je pokazao da se identièan rezultat može dobiti pomoæu jednog èlana ansambla (impulsnog odziva) izraèunavanjem inverznog vremenskog integrala kvadrata impulsnog odziva. Kriva dobijena na ovaj naèin predstavlja energiju impulsnog odziva preostalu posle trenutka t i naziva se Schroederova kriva ili EDC (Energy Decay Curve). Proširenje ovog metoda u cilju dobijanja odgovarajuæe krive u vremensko-frekvencijskoj ravni je prikazano u radu [1] gde je dobijena funkcija nazvana EDR (Energy Decay Relief) i gde je pokazano da je klasièna metoda sa bankama filtara samo jedna od moguæih realizacija EDR. Po definiciji EDR predstavlja usrednjavanje po ansamblu vremensko-frekvencijske reprezentacije opadanja nivoa reverberacije posle prestanka delovanja pobudnog signala ako je pobudni signal stacionarni beli šum. Takoðe u radu [1] je predloženo da se anvelopa odreðuje pomoæu kratkotrajne Furijeove transformacije (STFT) sa Blackman-Harisovim prozorom èetvrtog reda. izmerenog impulsnog odziva prostorije u vremenskofrekvencijskoj ravni koja je dobijena diskretnom wavelet transformacijom (DWT). Dat je prikaz realizacije nekoliko verzija ovog algoritma u kojima su korišæeni razlièiti waveleti. Na kraju je dato poreðenje rezultata dobijenih razlièitim algoritmima. Tekst je ilustrovan karakteristiènim rezultatima dobijenim pri merenju vremena reverberacije velike pozorišne sale pobuðene belim šumom èiji je impulsni odziv digitalno snimljen uèestanošæu odabiranja od 44100 Hz. II OPIS ALGORITMA Jedan od najveæih problema pri merenju vremena reverberacije na osnovu merenog impulsnog odziva je šum merenja koji izoblièuje oblik EDC i unosi grešku u izmereno vreme reverberacije. Pri integraciji ovaj šum smanjuje nagib EDC-a što rezultira veæim izmerenim vrednostima od stvarnih.. Poželjno bi bilo eliminisati uticaj šuma na integraciju. Slika 2. Spektrogram dobijen primenom STFT Slika 1. EDC i EDC bez uticaja šuma U ovom radu, prvo je opisana realizacija algoritma u kojoj se anvelopa raspodele energije odreðuje pomoæu STFT. Zatim je predložen algoritam za merenje vremena reverberacije pomoæu anvelope raspodele energije U literaturi su predložena dva naèina za ukalnjanje uticaja šuma uz pretpostavku da se šum merenja može smatrati stacionarnim tokom merenog impulsnog odziva. Jedan od predloženih naèina [1] se sastoji od procenjivanja snage šuma (odreðivanjem varijanse šuma) na poèetku ili kraju impulsnog odziva tj. tamo gde nema signala veæ je prisutan samo šum, da bi se zatim iz integracije izuzeli svi odbirci èiji je kvadrat amplitude ispod odreðenog praga u odnosu na procenjenu snagu šuma. Drugi naèin [2] je bolji od prvog i primenjen je u ovom radu. On se razlikuje od prvog po tome što se pre integracije procenjena snaga šuma oduzme od svih kvadriranih odbiraka impulsnog odziva (ovo je opravdano ako je šum merenja nekorelisan sa
signalom što je ispunjeno) èime neki odbirci u signalu postaju negativni. U delu gde je dominantan šum broj pozitivnih i negativnih odbiraka æe biti približno jednak. U tom delu EDC (integral) neæe rasti veæ æe se kolebati oko konstantne vrednosti. U delu impulsnog odziva u kome je dominantan signal EDC æe imati rast koji verno prati anvelopu signala. Ovo je prikazano na slici 1 gde se uoèava da je uklanjanjem uticaja šuma dobijena kriva èiji nagib prati anvelopu energije impulsnog odziva u mnogo veæem opsegu, što znaèi da æe se nagib te krive odreðivati na osnovu veæe kolièine podataka tj. na osnovu veæeg vremenskog opsega. Slika 4. EDR bez uticaja šuma na logaritamskoj frekv. skali Sledeæi korak predstavlja procenjivanje snage šuma u svakom opsegu što je realizovano odreðivanjem varijanse šuma. Na slici 5 je prikazan spektar procenjene snage šuma dobijen pomoæu STFT. Zatim se koristan signal u svakoj oktavi kvadrira èime dobijamo snagu signala. U svakom opsegu se od svakog sempla kvadriranog signala oduzme procenjena snaga šuma i tako dobijeni signal se integrali u inverznom vremenu èime dobijamo EDR tj. anvelopu raspodele energije u vremensko-frekvencijskoj ravni. Slika 3. EDR bez uticaja šuma na linearnoj frekv. skali Algoritam opisan u ovom radu je iste strukture u svim svojim verzijama. Razlike potièu od razlièitih naèina odreðivanja anvelope raspodele energije impulsnog odziva u vremensko-frekvencijskoj ravni. Ulazni podaci u algoritam su dva signala koje korisnik selektuje iz snimljenog impulsnog odziva. Prvi signal je onaj na osnovu koga æe se odreðivati vreme reverberacije, to je obièno eksponencijalno opadajuæi deo impulsnog odziva koji se na svom kraju utapa u šum. Zbog toga što postoji uklanjanje uticaja šuma na EDR nije bitno koliki je deo u kome je signal utopljen u šum. Drugi signal predstavlja deo impulsnog odziva u kome je dominantan šum. To je obièno deo koji je snimljen pre puštanja pobude ili sasvim pri kraju snimljenog odziva gde je signal dosta utopljen u šum. Nad oba signala se zatim vrši dekompozicija u vremensko-frekvencijsku ravan pomoæu STFT ili DWT što ustvari odgovara propuštanju signala kroz banku filtara sa odgovarajuæom decimacijom na izlazima filtara. Na slici 2 je prikazan spektrogram merenog impulsnog odziva dobijen primenom STFT sa Kajzerovim prozorom dužine 512. Slika 5. Spektar procenjene snage šuma Vreme reverberacije se odreðuje odreðivanjem nagiba linearnog dela EDR u svakom opsegu što se vrši linearnom interpolacijom. Postavlja se pitanje u kom opsegu odnosno u kojoj dužini od poèetka signala treba vršiti linearnu interpolaciju. Obièno se unošenje granica u kojima se vrši linearna interpolacija zahteva od korisnika no u radu [1] je predložen automatski postupak koji je ovde realizovan. Interpolacija se vrši nad koeficijentima koji su iznad eksperimentalno odreðene margine u odnosu na nivo šuma u svakom opsegu jer je u tom delu EDR približno linearan. Na slici 6 (koja je data na kraju rada) prikazani su signali dobijeni DWT dekompozicijom u devet oktava, EDR i margina šuma koja je 16 db iznad nivoa šuma.
Slika 7. Amplitudske karakteristike Blekman-Harisovog i Kajzerovog prozora III DISKUSIJA REZULTATA Jedan od naèina odreðivanja anvelope raspodele energije je pomoæu STFT. Parametri STFT (korišæeni prozor i preklapanje) odreðuju vremensko frekvencijsku rezoluciju. Umesto predloženog Blackman-Harisovog prozora èetvrtog reda korišæen je Kajzerov prozor (β=3.8*π). Koeficijenti ova dva prozora se razlikuju na èertvrtoj decimali a njihove amplitudske karakteristike su prikazane na slici 7 sa koje se vidi da oba postižu slabljenje veæe od 80 db u nepropusnom opsegu. Kajzerov prozor je pogodan zbog postojanja parametra β kojim se može poveæavati slabljenje u nepropusnom opsegu na raèun poveæanja širine propusnog opsega bez promene dužine prozora. Korišæeni prozor je dužine 512 èime se za uèestanost odabiranja od 44100 Hz postiže frekvencijska rezolucija od 68 Hz. Vremenska rezolucija je odreðena preklapanjem i iznosi oko 1.5 ms. Daljim eksperimentisanjem je utvrðeno da ovako velika vremenska rezolucija nije neophodna. Korišæenjem STFT dobijaju se uniformni opsezi te æe krajnji rezultat, prikazan na logaritamskoj skali uèestanosti imati nepotrebno veliku frekvencijsku rezoluciju na visokim uèestanostima dok æe na niskim uèestanostima rezolucija biti mala. Kao logièno rešenje nameæe se korišæenje dekompozicije koja bi bila neuniformna u frekvencijskom domenu pa je korišæena DWT kojom je signal podeljen u 9 oktavnih opsega. Na slikama 3 i 4 prikazani su EDR bez uticaja šuma na linearnoj i logaritamskoj frekvencijskoj skali. Prva verzija algoritma koristi DWT sa nadodabiranjem (Oversampled DWT) èime se postiže jednaka (nepotrebno velika) vremenska rezolucija u svakom opsegu. Ovo odgovara sluèaju kada se prilikom dekompozicije posle filtriranja ne koristi decimacija [3] tj. klasiènoj dekompoziciji signala pomoæu banke oktavnih filtara. Slika 8. Vreme reverberacije izmereno STFT I DWT metodom U sledeæoj verziji je korišæena DWT koja na visokim uèestanostim daje bolju vremensku rezoluciju nego na niskim uèestanostima. Ovim je skup podataka nad kojima se vrše operacije drastièno redukovan pa je algoritam dosta brži. Od ovako dekomponovanih podataka su odreðeni EDR koji su takoðe imali razlièite vremenske rezolucije po opsezima pa su EDR decimirane na vremensku rezoluciju krive sa najmanjom vremenskom rezolucijom što u našem sluèaju dekompozicije u 9 oktava iznosi 512 èime je dobijena vremenska rezolucija od oko 11 ms. Rezultati su pokazali da ovakvom redukcijom skupa podataka nije izgubljeno na preciznosti jer decimirani podaci služe za linearnu interpolaciju dela EDR krive koji je skoro linearan. Na slici 8 prikazani su rezultati odreðivanja vremena reverberacije dobijeni pomoæu prethodno opisanog algoritma i pomoæu algoritma koji koristi STFT. Sa slike se može uoèiti da se na srednjim uèestanostima dve krive prktièno poklapaju dok na visokim uèestanostima gde imamo veliki nagib promene vremena reverberacije kriva dobijena DWT dekompozicijom daje veæe vrednosti od krive dobijene STFT dekompozicijom. To može biti iz dva razloga: zbog nedovoljnog slabljenja u nepropusnom opsegu filtara korišæenih u DWT ili zbog suviše širokig propusnog opsega na visokim uèestanostima što rezultira time da je izmereno vreme reverberacije u celom opsegu približno jednako vremenu reverberacije na donjoj granici opsega jer tu vreme reverberacije ima najveæu vrednost. Zbog toga kriva dobijena DWT dekompozicijom deluje pomerena udesno u odnosu na krivu dobijenu STFT dekompozicijom što je najuoèljivije na visokim uèestanostima jer su tu najveæe razlike u velièinama opsega.
ili drugaèijom vrstom prikaza. Naime, izmerene vrednosti su prikazane za centralne uèestanosti oktava što se pokazalo nepraktièno na visokim uèestanostima. Slika 9. Amplidudska karakteristika banke filtara dobijene waveletima db44 (puna linija) i db10 (isprekidana linija) Slika 11. Vreme reverberacije izmereno STFT I DWT metodom Slika 10. Amplidudska karakteristika banke filtara dobijene optimalnim filtrom reda 256 U cilju odreðivanja uticaja slabljenja u nepropusnom opsegu sproveden je sledeæi eksperiment. Wavelet korišæen u dosada opisanim algoritmima je bio Daubechies wavelet reda 10, koji daje banku filtara karakteristike prikazane isprekidanom linijom na slici 9 sa koje se moze uoèiti da je slabljenje u nepropusnom opsegu veæe od 30 db. U cilju poveæanja slabljenja u nepropusnom opsegu korišæen je isti wavelet reda 44 èime se dobija banka filtara karakteristike prikazane punom linijom na slici 9 sa koje se uoèava da je slabljenje veæe od 120 db. Ovim se dobilo samo neznatno poboljšanje pa je u cilju daljeg smanjenja preklapanja meðu opsezima realizovan algoritam sa DWT koja je kao prototip filtrie koristila filtre reda 128 i 256, optialne u minimaks smislu projektovane Parks-McClellan postupkom koji daju banku karakteristike prikazane na slici 10. Za red filtra 128 dobija se slabljenje u nepropusnom opsegu veæe od 60 db a za red 256 slabljenje je veæe od 100 db. Na slici 11 su prikazani rezultati mernja vremena reverberacije dobijeni DWT dekompozicijom sa optimalnim filtrima reda 256, waveletom db10 i STFT dekompozicijom. Zumiran je samo deo visokih uèestanosti (2-18 khz) jer se samo na tom delu javljaju razlike. Može se uoèiti da je optimalnim filtrom postignuto najveæe smanjenje razlike na visokim uèestanostima od svih ovde opisanih algoritama. Preostala razlika je posledica širine opsega koja se može smanjiti primenom drugaèije dekompozicije, npr. u tercne opsege IV ZAKLJUÈAK U ovom radu prikazani su rezultati merenja vremena reverberacije pomoæu anvelope raspodele energije izmerenog impulsnog odziva prostorije u vremenskofrekvencijskoj ravni koja je dobijena STFT I DWT metodom. Opisan je naèin korišæen za smanjenje uticaja šuma na rezultate merenja. Algoritam sa DWT dekompozicijom u oktavne opsege je dosta brži i daje moguænost prikaza na logaritamskoj skali frekvencije. Sprovedena je analiza uticaja slabljenja u nepropusnom opsegu filtara banke analize na izmereno vreme reverberacije. Primeæeno je da svi algoritmi daju iste rezultate na niskim i srednjim uèestanostima dok na visokim uèestanostima algoritmi sa DWT daju nešto veæe vrednosti što je posledica prevelike širine opsega analize. Navedeni nedostatak se može otkloniti primenom wavelet dekompozicije u tercne opsege. LITERATURA [1] Jot, J.-M., Cerveau, L., Warusfel, O., Analysis and synthesis of room reverberation based on a statistical time-frequency model., AES: Convention of the Audio Engineering Society, September 1997. [2] Vanderkooy, J., Aspects of MLS measuring systems, J. Audio Eng. Soc. 42(4),1994 [3] Vetterli, M., Kovaèeviæ, J., Wavelets and Subband Coding, Prentice Hall, New Jersey, 1995 Abstract: In this paper algorithm for measuring reverberation time with measured impulse response energy envelope in time-frequency plane obtained by discrete wavelet transform is proposed. Impact of DWT decomposition filters stopband attenuation is examined. Results obtained by various wavelets are compared to results of algorithm in which energy envelope is obtained by STFT. In all algorithms method for decreasing impact of measuerement noise to measured reverberation time is applied. MEASURING REVERBERATION TIME USING DESCRETE WAVELET TRANSFORM, Igor Nikoliæ
Slika 6. Signali dobijeni DWT dekompozicijom u devet oktava, EDR i margina šuma