Planned maintenance
A system upgrade is planned for 10/12-2024, at 12:00-13:00. During this time DiVA will be unavailable.
Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Applied Speech Enhancement for Personal Communication
Responsible organisation
2003 (English)Licentiate thesis, comprehensive summary (Other academic)
Abstract [en]

In our daily life noise is almost constantly present. At the same time our need to communicate reliably has probably never been this great. Surrounding noise impairs our ability to communicate by speech and causes the users of a speech communication system to strain both their hearing and their voices. This licentiate thesis deals with speech enhancement for personal communication. A method for speech enhancement mainly aiming at every day communication situations is presented. The method boosts speech energy in a communication system, leaving background noise unaffected and it also tracks changes in background noise characteristics. Hence it is an \emph{adaptive} speech enhancement algorithm. This is desirable since the noise characteristics of most every day noisy situations are more or less rapidly changing. Methods for facilitating personal communication in severely disturbed environments are also presented. Instead of placing the communication microphone in front of the mouth, the microphone is placed inside the external auditory canal of the user. A pair of ear-muffs equipped with an active noise cancelling (ANC) system are fitted onto the user's head. This setup, possibly combined with some speech enhancement method, enables the user to communicate even under the most extreme noise situations. The setup characteristics are examined and the resulting speech quality and intelligibility are evaluated using a speech recognizer based on Hidden Markov Models.

Abstract [sv]

Buller är i princip konstant närvarande i vårt moderna dagliga liv. Samtidigt har vårt behov av säker och tillförlitlig kommunikation människor emellan kanske aldrig varit så stort. Omgivande buller påverkar vår förmåga att kommunicera med varandra negativt och tvingar användarna av ett kommunikationssystem att anstränga hörsel såväl som röster. Denna licentiatavhandling behandlar talkvalitetsförbättringsmetoder för personkommunikation. En metod för talkvalitetsförbättring som i huvudsak fokuserar på vardaglig personkommunikation presenteras. Metoden förstärker talenergi i det aktuella kommunikationssystemet men påverkar ej bakgrundsbullret. Metoden är adaptiv i meningen att den detekterar och följer förändringar i bakgrundsbullrets karaktäristik. Detta är önskvärt eftersom de flesta bullersituationer en användare utsätts för i verkliga livet är mer eller mindre snabbt föränderliga. Metoder för att underlätta personkommunikation i miljöer där det omgivande bullret är mycket kraftigt presenteras också. Istället för att - som normalt - placera kommunikationsmikrofonen framför munnen på användaren, placeras istället denna mikrofon i hörselgången på användaren. Därefter placeras ett par hörselkåpor utrustade med aktiv bullerreducering (ANC) över användaren öron. Med denna metod kan användaren kommunicera även i de mest extrema bullersituationer. Metoden kan även kombineras med någon form av talkvalitetsförbättringsalgoritm. Metoden utvärderas och den resulterande talkvalitén och taluppfattbarheten analyseras med hjälp av ett taligenkänningssystem baserat på en så kallad Hidden Markov Model (HMM).

Place, publisher, year, edition, pages
Karlskrona: Blekinge Institute of Technology , 2003. , p. 94
Series
Blekinge Institute of Technology Licentiate Dissertation Series, ISSN 1650-2140 ; 2
Keywords [en]
Speech Enhancement, Active Noise Control
National Category
Signal Processing
Identifiers
URN: urn:nbn:se:bth-00217Local ID: oai:bth.se:forskinfo141F6D0F6B6DABD1C1256D94002EE996ISBN: 91-7295-020-x (print)OAI: oai:DiVA.org:bth-00217DiVA, id: diva2:838355
Note
This Licentiate Thesis is also published at http://www.its.bth.se/staff/nweAvailable from: 2012-09-18 Created: 2003-09-01 Last updated: 2015-06-30Bibliographically approved

Open Access in DiVA

fulltext(3933 kB)480 downloads
File information
File name FULLTEXT01.pdfFile size 3933 kBChecksum SHA-512
765f033173255b88e18b1a26e1f23e48a1ba053c7c2bcde2db8bb70ea66e105c6bf4f6d3182572c2da5c78b0359b86786cb10825351f49305752de1f65ba430e
Type fulltextMimetype application/pdf

Signal Processing

Search outside of DiVA

GoogleGoogle Scholar
Total: 480 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

isbn
urn-nbn

Altmetric score

isbn
urn-nbn
Total: 184 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf