Natural Language Processing Faculty Publications

Diacritic Recognition Performance in Arabic ASR

Hanan Aldarmaki, Mohamed bin Zayed University of Artificial IntelligenceFollow
Ahmad Ghannam, Mohamed bin Zayed University of Artificial Intelligence

Document Type

Conference Proceeding

Publication Title

Proceedings of the Annual Conference of the International Speech Communication Association, INTERSPEECH

Abstract

In Arabic text, most vowels are encoded in the form of diacritics that are often omitted, so most speech corpora and ASR models are undiacritized. Text-based diacritization has previously been used to preprocess the input or post-processs ASR hypotheses. It is generally believed that input diacritization degrades ASR quality, but no systematic evaluation of ASR diacritization performance has been conducted to date. We experimentally clarify whether input diacritiztation indeed degrades ASR quality and compare ASR diacritization with text-based diacritization. We fine-tune pre-trained ASR models on transcribed speech with different diacritization conditions: manual, automatic, and no diacritization. We isolate diacritic recognition performance from the overall ASR performance using coverage and precision metrics. We find that ASR diacritization significantly outperforms text-based diacritization, particularly when the ASR model is fine-tuned with manually diacritized transcripts. © 2023 International Speech Communication Association. All rights reserved.

First Page

361

Last Page

365

DOI

10.21437/Interspeech.2023-2344

Publication Date

8-2023

Keywords

Speech communication, Arabic speech recognition, Arabic texts, Automatic diacritization, Condition, Performance, Preprocess, Speech corpora, Systematic evaluation, Speech recognition

Comments

Green Open Access

Access available on ISCA Archive

Recommended Citation

H. Aldarmaki and A. Ghannam, “Diacritic recognition performance in Arabic ASR,” INTERSPEECH 2023, Aug 2023. doi:10.21437/interspeech.2023-2344

Additional Links

http://doi.org/10.21437/Interspeech.2023-2344

Link to Full Text

COinS

Natural Language Processing Faculty Publications

Diacritic Recognition Performance in Arabic ASR

Document Type

Publication Title

Abstract

First Page

Last Page

DOI

Publication Date

Keywords

Comments

Recommended Citation

Additional Links

Browse

Contribute

Links

Natural Language Processing Faculty Publications

Diacritic Recognition Performance in Arabic ASR

Authors

Document Type

Publication Title

Abstract

First Page

Last Page

DOI

Publication Date

Keywords

Comments

Recommended Citation

Additional Links

Share

Browse

Contribute

Links