Change search
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf
Automated Boulder Localization and Recognition in Side-Scan Sonar Data Using Deep Learning Approach
Blekinge Institute of Technology, Faculty of Computing, Department of Computer Science.
Blekinge Institute of Technology, Faculty of Computing, Department of Computer Science.
2025 (English)Independent thesis Advanced level (professional degree), 20 credits / 30 HE creditsStudent thesis
Abstract [en]

Background: Detecting boulders in side-scan sonar (SSS) imagery is critical for offshore infrastructure planning, marine habitat studies, and seabed surveying. Traditional manual detection is time-consuming, subjective, and inefficient, especially for large-scale surveys. Although deep learning offers strong potential for automating this process, applying it to sonar data is challenging due to noise, variability in acquisition settings, and imaging inconsistencies. 

Objectives: This study aims to develop, implement, and evaluate a deep learningbased pipeline for automatic boulder detection and classification in side-scan sonar data. It investigates how preprocessing, detection, and classification strategies impact detection performance and explores improvements over traditional manual analysis. 

Methods: Raw SSS data were first preprocessed through water column removal, ping energy normalization, contrast stretching, contrast-gamma correction, and filtering to enhance image clarity. A two-stage deep learning system was implemented: YOLOv11 and Faster R-CNN models were trained for object detection, followed by a lightweight ResNet18 classifier for filtering false positives. Models were evaluated using precision, recall, F1 score, mAP@[.5:.95], and accuracy, on diverse sonar lines with varying seabed textures and boulder densities. 

Results: The best model, based on Faster R-CNN withclassifier integration, achieved a precision of 0.739, recall of 0.882, accuracy of 0.734, and mAP of 0.409. Port-side f lipping and multi-line training notably improved generalization and reduced false positives. Automated detection was approximately 92 times faster than manual picking, demonstrating significant time savings and operational efficiency. 

Conclusions: Deep learning, supported by systematic preprocessing and a two-stage detection-classification pipeline, offers a reliable and scalable solution for automated boulder detection in side-scan sonar imagery. The approach addresses previous challenges related to generalization and false positives, providing practical applications for marine surveys and a solid foundation for future research.

Abstract [sv]

Bakgrund: Att identifiera sten i Side-Scan Sonar (SSS)-bilder är avgörande för planering av offshore-infrastruktur, marina habitatstudier och kartläggning av havsbotten. Traditionell manuell identifiering är tidskrävande, subjektiv och ineffektiv vid storskaliga undersökningar. Djupinlärning erbjuder stark potential för att automatisera denna process, men tillämpningen på sonar-data är utmanande på grund av brus, variationsrika inspelningsförhållanden och bildmässiga inkonsekvenser.

Syfte: Syftet med denna studie är att utveckla, implementera och utvärdera en pipeline baserad på djupinlärning för automatisk lokalisering och klassificering av sten i Side-Scan Sonar data. Studien undersöker hur förbehandling, detektion och klassificering påverkar detektionsprestandan och hur dessa strategier kan förbättra noggrannheten jämfört med manuell analys.

Metod: RåSSS-dataförbehandlades genom borttagning av vattenkolumn, normalisering av pingenergi, kontraststräckning, kontrast-gamma korrigering och filtrering för att förbättra bildens klarhet och enhetlighet. Ett tvåstegs djupinlärning baserat system implementerades: YOLOv11 och Faster R-CNN användes för objektdetektering, följt av en lättviktsklassificerare baserad på ResNet18 för att filtrera bort falska positiva. Modellerna utvärderades med precision, recall, F1-poäng, mAP@[.5:.95] och noggrannhet på olika sonarlinjer med varierande bottenförhållanden och stentätheter.

Resultat: Den bästa modellen, baserad på Faster R-CNN med klassificeringsfilter, uppnådde en precision på 0.739, en recall på 0.882, en noggrannhet på 0.734 och ett mAP på 0.409. Tekniker som port-sida vändning och träning på flera linjer förbättrade modellens generaliseringsförmåga och minskade antalet falska positiva. Det automatiserade systemet var cirka 92 gånger snabbare än manuell stenidentifiering, vilket visar på betydande tidsbesparingar och operationell effektivitet.

Slutsatser: Djupinlärning, i kombination med systematisk förbehandling och en tvåstegs detektions- och klassificeringspipeline, erbjuder en pålitlig och skalbar lösning för automatisk stendetektion i Side-Scan Sonar data. Metoden adresserar tidigare identifierade utmaningar såsom bristande generalisering och hög förekomst av falska positiva, och erbjuder därmed både praktiska tillämpningar för marina undersökningar och en grund för framtida forskning.

Place, publisher, year, edition, pages
2025. , p. 71
Keywords [en]
Side-Scan Sonar, Boulder Detection, YOLO, Faster R-CNN, Image Preprocessing
Keywords [sv]
Side-Scan Sonar, Stendetektion, YOLO, Faster R-CNN, Bildförbehandling
National Category
Artificial Intelligence
Identifiers
URN: urn:nbn:se:bth-27949OAI: oai:DiVA.org:bth-27949DiVA, id: diva2:1962566
External cooperation
NKT
Subject / course
Degree Project in Master of Science in Engineering 30,0 hp
Educational program
DVAMI Master of Science in Engineering: AI and Machine Learning 300 hp
Supervisors
Examiners
Available from: 2025-06-11 Created: 2025-05-31 Last updated: 2025-09-30Bibliographically approved

Open Access in DiVA

fulltext(49839 kB)685 downloads
File information
File name FULLTEXT01.pdfFile size 49839 kBChecksum SHA-512
7fa10b0988f1dc2a10d3a32a7eb951a64c7b983d966d57a6c9676a741f7a6db69288533c497bac434f32399058df390d3dcbf29aa8e80edb7a663e296013ffff
Type fulltextMimetype application/pdf

By organisation
Department of Computer Science
Artificial Intelligence

Search outside of DiVA

GoogleGoogle Scholar
Total: 685 downloads
The number of downloads is the sum of all downloads of full texts. It may include eg previous versions that are now no longer available

urn-nbn

Altmetric score

urn-nbn
Total: 539 hits
CiteExportLink to record
Permanent link

Direct link
Cite
Citation style
  • apa
  • ieee
  • modern-language-association-8th-edition
  • vancouver
  • Other style
More styles
Language
  • de-DE
  • en-GB
  • en-US
  • fi-FI
  • nn-NO
  • nn-NB
  • sv-SE
  • Other locale
More languages
Output format
  • html
  • text
  • asciidoc
  • rtf