Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Speech Enhancement using Constrained-ICA with Bessel Features
Blekinge Institute of Technology, School of Engineering.
Blekinge Institute of Technology, School of Engineering.
2011 (English)Independent thesis Advanced level (degree of Master (Two Years))Student thesis
Abstract [en]

In this thesis, we proposed an approach for extracting a desired speech signal from a mixed source signal using the ICA-R algorithm and Bessel features. Here the desired speech signal and the reference signal are two different speech utterances of a same speaker. In the current existing literature most of the methods deal with designing the reference signal with prior information of the target speech signal. The crucial problem is the design of reference signal in advance which is close to the desired signal when the desired source signal is very week in mixed signals and also when there is no prior information about the desired source signal. In the proposed method we do not require any prior information about the desired speech signal that has to be extracted. The ICA-R algorithm is extended to use Bessel coefficients of the observed signals and the reference signal for processing as they are more efficient in representing speech-like waveform. From the simulation results and the performance analysis in chapter 4, comparing the proposed method with one of the previous existing methods shows that the proposed method is more effective. This shows that the computation done at the feature level i.e. the Bessel coefficients of the signals yields better results than on the sample values. This is very useful for many applications such as speaker verification, speaker identification and so on even when the desired signal is very week in mixed signals. An example of real world application where the proposed method is useful is the voice recognition and speaker verification login even in the presence of external disturbances and also in voice security applications.

Abstract [sv]

I denna avhandling har vi föreslagit en metod för att utvinna en önskad tal signal från en blandad källa signal genom att använda ICA-R algoritm och Bessel funktioner. Här önskad talsignalen och referenssignalen är två olika tal yttranden på ett och samma högtalare. I den nuvarande befintlig litteratur flesta av metoderna behandlar utformningen referenssignalen med förhandsinformation till målet talsignalen. Det avgörande problemet är utformningen av referenssignalen i förväg vilket är nära den önskade signalen när önskad signalkälla är mycket vecka i blandade signaler och även när det inte finns någon tidigare information om den önskade signalen. I den föreslagna metoden vi inte kräver någon som helst förhandsinformation om den önskade talsignalen som ska extraheras. ICA-R algoritm utvidgas till att använda Bessel koefficienter av de observerade signaler och referenssignalen för bearbetning eftersom de är mer effektiva i motsvarande tal-liknande vågform. Från simuleringen resultat och resultatanalys i kapitel 4, jämföra den föreslagna metoden med en av de tidigare befintliga metoder visar att den föreslagna metoden är mer effektiv. Detta visar att beräkningen görs på funktionen nivå dvs Bessel koefficienter av signalerna ger bättre resultat än på provet värden. Detta är mycket användbart för många applikationer såsom verifiering av talare, högtalare identifiering och så vidare även när den önskade signalen är mycket vecka i blandade signaler. Ett exempel på verkliga världen ansökan då den föreslagna metoden är användbar är röstigenkänning och verifiering av talare login även i närvaro av yttre störningar och även i rösten säkerhetsapplikationer.

Place, publisher, year, edition, pages
2011. , 42 p.
Keyword [en]
Independent Component Analysis, Speech Recognition, Fourier Bessel Features
National Category
Signal Processing
Identifiers
URN: urn:nbn:se:bth-2403Local ID: oai:bth.se:arkivexF25414692709D32AC12578290063C7EDOAI: oai:DiVA.org:bth-2403DiVA: diva2:829678
Uppsok
Technology
Supervisors
Available from: 2015-04-22 Created: 2011-01-31 Last updated: 2015-06-30Bibliographically approved

Open Access in DiVA

fulltext(1703 kB)136 downloads
File information
File name FULLTEXT01.pdfFile size 1703 kBChecksum SHA-512
085f3cd4c05fff7030ab88789b2215e3eb77037c798eba7b9c07075d80c7787f055a8aa91e396dfe0941cd0851d0cfd0dac658b507d91e1657e69c163e17f5f8
Type fulltextMimetype application/pdf

By organisation
School of Engineering
Signal Processing

Search outside of DiVA

GoogleGoogle Scholar
Total: 136 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

Total: 30 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf