Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Speech enhancement methods in hands-free communication with emphasis on Optimal SNIR Beamformer
Blekinge Institute of Technology, School of Engineering.
2012 (English)Independent thesis Advanced level (degree of Master (Two Years))Student thesisAlternative title
Tal förbättring metoder i handsfree-kommunikation med tonvikt på Optimal SNIR strålformaren (Swedish)
Abstract [en]

A basic speech enhancement can be achieved by the suppression of background noise and reverberation from the clean speech. The point to be noted is to achieve it with a low computational complexity. The aim is to estimate signal arriving optimally from the desired direction in the presence of reverberant-noisy speech signal. Recent studies show that this can be achieved by designing various kinds of robust fixed and adaptive beamformers. A beamformer does spatial filtering in the sense that it separates two signals with overlapping frequency content originating from distinctive directions. In this contribution, robust beamformers namely Elkos beamformer, Wiener beamforming and optimal signal to noise interference ratio (SNIR) beamformer are designed and analyzed collaboratively in a group under the consideration of hearing aid constraints such as the microphone distance and different real world room dimensions. A fractionally delayed (FD) all pass Thiran filters are designed to get a maximally flat group delay. A virtual room image model is designed to achieve different dimensions of the room and their reverberant speech signals. The objective of this thesis is to design and implement an optimal SNIR beamformer in anechoic and reverberant environments with different noises, i.e. wind, white, factory and interference. It is implemented and simulated offline in MATLAB. The performance of the optimal SNIR Beamformer is evaluated by considering the objective measures such as SNRI, SD, ND, RR and PESQI under different noisy environments in anechoic and reverberated environments. These parameters are measured by assuming input SNR levels at 0dB, 5dB, 10 dB, 15 dB, 20 dB and 25 dB. In addition to this a new parameter RR is also evaluated in reverberated environment. This parameter is measured by varying the number of microphones. The reverberation power suppression is analyzed by using RR. Speech quality is analyzed based on signal to noise ratio Improvement and speech intelligibility is measured using PESQ for different noisy environments. Results show that optimal SNIR beamformer performs best compared to all other beamformers due to its inherent properties.

Abstract [sv]

En grundläggande tal förbättring kan uppnås genom undertryckande av bakgrundsbrus och efterklang från den rena tal. Den punkt som skall noteras är att uppnå den med en låg beräkningskomplexitet. Syftet är att uppskatta signal som anländer optimalt från den önskade riktningen i närvaro av reverberenta-brusig talsignal. Nyligen genomförda studier visar att detta kan uppnås genom att konstruera olika typer av robusta fasta och adaptiv lobformare. En lobformare inte rymdfiltrering i den meningen att den separerar två signaler med överlappande frekvenser som härrör från distinkta riktningar. I detta bidrag Elkos robusta lobformare nämligen strålbildaren, Wiener lobformning och optimal signal-brus interferens förhållande (SNIR) strålbildaren utformas och analyseras samarbeta i en grupp under övervägande av hörapparat begränsningar, till exempel mikrofonen avståndet och olika verkliga dimensioner rum. En bråkdel försenade (FD) alla pass Thiran filter är utformade för att få en maximalt flat grupplöptid. Ett virtuellt rum bilden är utformad för att uppnå olika dimensioner i rummet och deras ekande signaler tal.            Syftet med denna uppsats är att utforma och genomföra en optimal SNIR strålbildaren i ekofria och reverberenta miljöer med olika ljud, dvs vind, vit, fabriker och störningar. Den genomförs och simulerade offline i MATLAB. Utförandet av den optimala SNIR strålbildaren utvärderas genom att beakta de objektiva åtgärder som SNRI, SD, ND, RR och PESQI under olika bullriga miljöer i ekofria och ekade miljöer. Dessa parametrar mäts genom ett antagande in SNR nivåer 0dB, 5 dB, 10 dB, 15 dB, 20 dB och 25 dB. Utöver detta en ny parameter RR, utvärderas även återreflekteras miljö. Denna parameter mäts genom att variera antalet mikrofoner. Efterklangstiden effektdämparstavar analyseras med hjälp av RR. Tal kvalitet analyseras utifrån signal-brus-förhållande Förbättring och taluppfattbarhet mäts med PESQ för olika bullriga miljöer. Resultaten visar att optimal SNIR strålbildaren bästa utför jämfört med alla andra lobformare på grund av dess inneboende egenskaper.

Place, publisher, year, edition, pages
2012. , 72 p.
Keyword [en]
signal to noise ratio, Beamforming, Reverberated and Anechoic, Speech intelligibility, Reverberation.
National Category
Signal Processing Electrical Engineering, Electronic Engineering, Information Engineering
Identifiers
URN: urn:nbn:se:bth-4196Local ID: oai:bth.se:arkivex9AA6F2D30F96D0B3C1257A24004EA75EOAI: oai:DiVA.org:bth-4196DiVA: diva2:831521
Uppsok
Technology
Supervisors
Note
M.Thyagaraju, H.no 5/72, Bhairavanager, Behind JNTU college, ANANTAPUR, Andhra Pradesh, India-515002. EmailID:hami10@student.bth.se Contact PH: 0046760310134, 00919440508157.Available from: 2015-04-22 Created: 2012-06-21 Last updated: 2015-06-30Bibliographically approved

Open Access in DiVA

fulltext(2190 kB)138 downloads
File information
File name FULLTEXT01.pdfFile size 2190 kBChecksum SHA-512
ed38cbf24041055163c7ddc7089f3b7f685d96af628edb8e618c8194b8effee0ee94a410a60cd6ec221bd5bea2bebcb77099ba6d48c8b89f9443482bfdd6c53c
Type fulltextMimetype application/pdf

By organisation
School of Engineering
Signal ProcessingElectrical Engineering, Electronic Engineering, Information Engineering

Search outside of DiVA

GoogleGoogle Scholar
Total: 138 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 131 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf