A Multi-Layer Transcription Model – concept outline
PDF

Keywords

G2P
grapheme-to-phoneme conversion
Polish language
text processing

How to Cite

Śledziński, D. (2023). A Multi-Layer Transcription Model – concept outline. Lingua Posnaniensis, 64(1), 49–71. https://doi.org/10.14746/linpo.2022.64.1.3

Abstract

This paper discusses the assumptions of a Multi-Layer Transcription Model (hereinafter: MLTM). The solution presented is an advanced grapheme-to-phoneme (G2P) conversion method that can be implemented in technical applications, such as automatic speech recognition and synthesis systems. The features of MLTM also facilitate the application of text-to-transcription conversion in linguistic research. The model presented here is the basis for multi-step processing of the orthographic representation of words with those being transcribed gradually. The consecutive stages of the procedure include, among other things, identification of multi-character phonemes, voicing status change, and consonant clusters simplification. The multi-layer model described in this paper makes it possible to assign individual phonetic processes (for example assimilation), as well as other types of transformation, to particular layers. As a result, the set of rules becomes more transparent. Moreover, the rules related to any process can be modified independently of the rules connected with other forms of transformation, provided that the latter have been assigned to a different layer. These properties of the multi-layer transcription model in question provide crucial advantages for the solutions based on it, such as their flexibility and transparency. There are no assumptions in the model about the applicable number of layers, their functions, or the number of rules defined in each layer. A special mechanism used for the implementation of the MLTM concept enables projection of individual characters onto either a phonemic or a phonetic transcript (obtained after processing in the final layer of the MLTM-based system has been completed). The solution presented in this text has been implemented for the Polish language, however, it is not impossible to use the same model for other languages.

https://doi.org/10.14746/linpo.2022.64.1.3
PDF

References

Chomszyn, J. 1986. A phonemic transcription program for Polish. International Journal of Man-Machine Studies 25. 271-293. DOI: https://doi.org/10.1016/S0020-7373(86)80061-X

Demenko, G. & Wypych, M. & Baranowska, E. 2003. Implementation of grapheme-to-phoneme rules and extended SAMPA alphabet in Polish text-to-speech synthesis. In Demenko, G. & Karpiński, M. (eds.), Speech and language technology, vol. 7, 79-96. Poznań: Polskie Towarzystwo Fonetyczne.

Dobrogowska, K. 1984. Śródgłosowe grupy spółgłosek w polskich tekstach popularnonaukowych. Polonica 10. 15-34.

Dobrogowska, K. 1990. Word internal consonant clusters in Polish artistic prose. Studia Phonetica Posnaniensia 2. 43-67.

Dobrogowska, K. 1992. Word initial and word final consonant clusters in Polish popular science text and in artistic prose. Studia Phonetica Posnaniensia 3. 47-121.

Dukiewicz, L. 1985. Nagłosowe grupy spółgłosek w polskich tekstach popularnonaukowych i prasowych. Studia Gramatyczne 6. 17-34.

Dunaj, B. 1985. Grupy spółgłoskowe współczesnej polszczyzny mówionej (w języku mieszkańców Krakowa). Warszawa – Kraków: Państwowe Wydawnictwo Naukowe PWN.

Dunaj, B. 1986. Wygłosowe grupy spółgłoskowe współczesnej polszczyzny mówionej. Zeszyty Naukowe Uniwersytetu Jagielońskiego: Prace Językoznawcze 82. 103-117.

Jassem, K. 1996. A phonemic transcription – syllable division rule engine. In Proceedings of ONOMASTICA–COPERNICUS Research Colloquium Edinburgh (pages unknown). Edinburgh: Centre for Communication Interface Research, University of Edinburgh.

Kłosowski, P. 2016. Algorithm and implementation of automatic phonemic transcription for Polish. In Proceedings of 20th IEEE International Conference Signal Processing Algorithms, Architectures, Arrangements and Applications, 298-303. Poznań: University of Technology. DOI: https://doi.org/10.1109/SPA.2016.7763631

Koržinek, D. & Brocki, Ł. & Marasek, K. 2016a. Polish grapheme-to-phoneme tool and service. (http://hdl.handle.net/11321/295) (Accessed 2022-10-02)

Koržinek, D. & Marasek, K. & Brocki, Ł. 2016b. Polish read speech corpus for speech tools and services. In Proceedings, CLARIN Annual Conference 2016, Aix-en-Provence: Common Language Resources and Technology Infrastructure. (https://www.clarin.eu/sites/default/files/korzinek-etal-CLARIN2016_paper_20.pdf) (Accessed 2022-10-02)

Lorenc, A. 2016. Wymowa normatywna polskich samogłosek nosowych i spółgłoski bocznej. Warszawa: Dom Wydawniczy ELIPSA.

Lorenc, A. & Ptaszkowska, A. 2015. Programowanie języka dziecka z uszkodzeniem słuchu z zastosowaniem metody audytywno-werbalnej: Studium przypadku. Logopedia Silesiana 4. 229-247.

Maksymienko, M. & Bolc, L.1981. Komputerowy system przetwarzania tekstów fonematycznych. Warszawa: Wydawnictwa Uniwersytetu Warszawskiego.

Nowak, I. 1995. Transkrypcja fonematyczna tekstów polskich. In Pogonowski, J. (ed.), Eufonia i logos. Poznań. Wydawnictwo Naukowe UAM.

Ostaszewska, D. & Tambor, J. 2000. Fonetyka i fonologia współczesnego języka polskiego. Warszawa: Wydawnictwo Naukowe PWN.

Pluciński, A. 1992. Rekonstrukcja reguł transkrypcji fonematycznej na podstawie próby uczącej. Poznań: Wydawnictwo Naukowe UAM.

Przybysz, P. & Kasprzak, W. 2013. The generation of letter-to-sound rules for grapheme-to-phoneme conversion. In 6th International Conference on Human System Interactions (HSI) (Sopot, Poland), 292-297. IEEE (Institute of Electrical and Electronics Engineers). (https://ieeexplore.ieee.org/document/6577838) (Accessed 2022-10-02) DOI: https://doi.org/10.1109/HSI.2013.6577838

Retz, R.I. 1989. Zanik korelacji palatalności we współczesnej polszczyźnie ogólnej. Poradnik Językowy. 1. 20-32; 2. 90-99; 3. 160-168.

Rocławski, B. 1984. Palatalność: Teoria i praktyka. Gdańsk: Uniwersytet Gdański. Wydawnictwo.

Rocławski, B. 2001. Podstawy wiedzy o języku polskim dla glottodydaktyków, pedagogów, psychologów i logopedów. Gdańsk: Glottispol.

Sawicka, I. 1988. Fonologia konfrontatywna polsko-serbsko-chorwacka. Wrocław: Zakład Narodowy im. Ossolińskich.

Sawicka, I. (ed.). 2007. Komparacja współczesnych języków słowiańskich. Vol. 2. Fonetyka i fonologia. Opole: Wydawnictwo Uniwersytetu Opolskiego.

Sawicka, I. & Grzybowski, S. 1999. Studia z palatalności w językach słowiańskich. Vol. 1. Toruń: Wydawnictwo Naukowe UMK.

Skurzok, D. & Ziółko, B. & Ziółko, M. 2015. Ortfon2 – tool for orthographic to phonetic transcription. In 7th Language & Technology Conference, 115-119. Poznań: Adam Mickiewicz University. (http://ltc.amu.edu.pl/a2015/book/papers/SPEECH1-2.pdf) (Accessed 2022-10-02)

Śledziński, D. 2019. Asymilacja dźwięczności w polskich grupach spółgłoskowych. Poznań: Bogucki Wydawnictwo Naukowe. DOI: https://doi.org/10.12657/book-19-001

Steffen-Batóg, M. 1989-1990. Rules for the mutual conversion of the phonemic and phonetic transcriptions of the Polish texts. Lingua Posnaniensis 32-33. 211-223.

Steffen-Batóg, M. & Nowakowski, P. 1992. An algorithm for phonetic transcription of orthographic texts in Polish. Studia Phonetica Posnaniensia 3. 135-183.

Steffen-Batogowa, M. 1973. The problem of automatic phonemic transcription of written Polish. Biuletyn Fonograficzny XIV. 75-86.

Steffen-Batogowa, M. 1975. Automatyzacja transkrypcji fonematycznej tekstów polskich. Warszawa: Państwowe Wydawnictwo Naukowe.

Szpyra-Kozłowska, J. 2007. Inwentarze fonemów języka polskiego i ich konsekwencje. Logopedia 31. 7-26.

Warmus, M. 1972. Program na maszynę Odra-1204 dla automatycznej transkrypcji fonematycznej tekstów języka polskiego. Prace CO PAN 66. 1-22.

Wells, J. 1997. SAMPA computer readable phonetic alphabet. In Gibbon, D. & Moore, R., & Winski, R. (eds.), Handbook of standards and resources for spoken language systems, part IV, section B. Berlin – New York: Mouton de Gruyter.

Wolańska, E. 2019. System grafematyczny współczesnej polszczyzny na tle innych systemów pisma. Warszawa: Dom Wydawniczy ELIPSA.

Wypych. M. 1999. Implementacja algorytmu transkrypcji fonematycznej. In Jassem, W. & Basztura, Cz., & Demenko, G., & Jassem, K. (eds.), Speech and language technology, vol. 3, 89-105. Poznań: Polskie Towarzystwo Fonetyczne.