RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf
Unsupervised Text Binarization in Handwritten Historical Documents Using k-Means Clustering
Blekinge Tekniska Högskola, Fakulteten för datavetenskaper, Institutionen för datalogi och datorsystemteknik. Blekinge Inst Technol, Dept Comp Sci & Engn, S-37141 Karlskrona, Sweden..ORCID-id: 0000-0001-7536-3349
2018 (Engelska)Ingår i: PROCEEDINGS OF SAI INTELLIGENT SYSTEMS CONFERENCE (INTELLISYS) 2016, VOL 2 / [ed] Bi, Y Kapoor, S Bhatia, R, SPRINGER INTERNATIONAL PUBLISHING AG , 2018, s. 23-32Konferensbidrag, Publicerat paper (Refereegranskat)
Abstract [en]

In this paper, we propose a novel technique for unsupervised text binarization in handwritten historical documents using k-means clustering. In the text binarization problem, there are many challenges such as noise, faint characters and bleed-through and it is necessary to overcome these tasks to increase the correct detection rate. To overcome these problems, preprocessing strategy is first used to enhance the contrast to improve faint characters and Gaussian Mixture Model (GMM) is used to ignore the noise and other artifacts in the handwritten historical documents. After that, the enhanced image is normalized which will be used in the postprocessing part of the proposed method. The handwritten binarization image is achieved by partitioning the normalized pixel values of the handwritten image into two clusters using k-means clustering with k = 2 and then assigning each normalized pixel to the one of the two clusters by using the minimum Euclidean distance between the normalized pixels intensity and mean normalized pixel value of the clusters. Experimental results verify the effectiveness of the proposed approach.

Ort, förlag, år, upplaga, sidor
SPRINGER INTERNATIONAL PUBLISHING AG , 2018. s. 23-32
Serie
Lecture Notes in Networks and Systems, ISSN 2367-3370 ; 16
Nyckelord [en]
Handwritten text binarization, Image processing, k-means clustering, Document images
Nationell ämneskategori
Datavetenskap (datalogi)
Identifikatorer
URN: urn:nbn:se:bth-17280DOI: 10.1007/978-3-319-56991-8_3ISI: 000448662500003ISBN: 978-3-319-56991-8 (tryckt)OAI: oai:DiVA.org:bth-17280DiVA, id: diva2:1263360
Konferens
SAI Annual Conference on Areas of Intelligent Systems and Artificial Intelligence and their Applications to the Real World (IntelliSys), SEP 21-22, 2016, London, ENGLAND
Tillgänglig från: 2018-11-15 Skapad: 2018-11-15 Senast uppdaterad: 2019-04-05

Open Access i DiVA

fulltext(2623 kB)37 nedladdningar
Filinformation
Filnamn FULLTEXT01.pdfFilstorlek 2623 kBChecksumma SHA-512
2a7e3b9cb9a7fdad1c4eb30b8b537f85242a9b86b21cfa294eeb061b71b5fa5f63b61876515547f3904fb19a1ae4ba0d37d26ed9dfd07b83fb029da44dc76149
Typ fulltextMimetyp application/pdf

Övriga länkar

Förlagets fulltext

Personposter BETA

Kusetogullari, Hüseyin

Sök vidare i DiVA

Av författaren/redaktören
Kusetogullari, Hüseyin
Av organisationen
Institutionen för datalogi och datorsystemteknik
Datavetenskap (datalogi)

Sök vidare utanför DiVA

GoogleGoogle Scholar
Totalt: 37 nedladdningar
Antalet nedladdningar är summan av nedladdningar för alla fulltexter. Det kan inkludera t.ex tidigare versioner som nu inte längre är tillgängliga.

doi
isbn
urn-nbn

Altmetricpoäng

doi
isbn
urn-nbn
Totalt: 56 träffar
RefereraExporteraLänk till posten
Permanent länk

Direktlänk
Referera
Referensformat
  • apa
  • harvard1
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Annat format
Fler format
Språk
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Annat språk
Fler språk
Utmatningsformat
  • html
  • text
  • asciidoc
  • rtf