Automatyczna analiza morfologiczna jako narzedzie oceny poprawnosci wyrazów jezyka rosyjskiego
PDF

Jak cytować

Fiedoruszkow, J. (2005). Automatyczna analiza morfologiczna jako narzedzie oceny poprawnosci wyrazów jezyka rosyjskiego. Investigationes Linguisticae, 12, 33–43. https://doi.org/10.14746/il.2005.12.4

Abstrakt

Processes of lemmatizing are beginning to play a very important role in contemporary linguistic methods. A lemmatizer as an instrument in computer analysis morphologically analizes texts and corpuses of texts and at the same time functions as a program module and a lemmatizing algorithm. The identification of lexemes depends on the organization of the dictionary data. One of the examples of the practical results of lemmatization is the set of unrecognized words (with a precise determination of the membership of morphological markers and parts of speech) in a language. In this paper, the methodological description of the use of the program Lemmatizer with the use of an electronic text (as an example) in Russian is proposed.

https://doi.org/10.14746/il.2005.12.4
PDF

Bibliografia

Bień, J.S., Szafran, K. 2001. Analiza morfologiczna języka polskiego w praktyce. Biuletyn Polskiego Towarzystwa Językoznawczego LVII, 171 - 184.

Daciuk, J. 1999. A Module for Treatment of Unknown Words. Speech andLanguage Technology 3, 165 - 169.

Graliński, F. 1998. Realizacja półautomatycznej ekstrakcji leksemów występujących w korpusie polskich tekstów informatycznych. Speech and Language Technology 2, 127 - 135.

Graliński, F., Krynicki, G. 2000. Word-Formation Analysis in Polish-to-English Machine Translation. Speech and Language Technology 4, 185 - 203.

Linde-Usiekniewicz, J. (red.). 2002. Wielki słownik angielsko-polski. Warszawa: PWN.

Oflazer, K. 1996. Error-tolerant finite state recognition with applications to morphological analysis and spelling correction. Computational Linguistics 22 (1), 73 - 89.

Rabiega-Wiśniewska, J., Rudolf, M. 2002. AMOR - program automatycznej analizy fleksyjnej tekstu polskiego. Biuletyn Polskiego Towarzystwa Językoznawczego LVIII, 175 - 185.

Sambor, J. 1975. O słownictwie statystycznie rzadkim (na materiale derywatów we współczesnej publicystyce polskiej). Warszawa: PWN.

Smith, G.W. 1991. Computers andHuman Language. New York - Oxford: Oxford University Press.

Suszczańska, N., Forczek, M., Migas, A. 2000. Wieloetapowy analizator morfologiczny. Speech and Language Technology 4, 55 - 65.

Szafran, K. 1997. Automatyczne hasłowanie tekstu polskiego. Polonica XVIII, 51 - 64.

Wawrzyńczyk, J., Bolszowa, J., Radolińska, W., 1977. Słowotwórstwo i fleksja współczesnego języka rosyjskiego. Łódź: Wydawnictwo UŁ.

Wawrzyńczyk, J. (red.). 2004. Wielki słownik rosyjsko-polski z Kluczem polsko-rosyjskim. Warszawa: PWN.

Wawrzyńczyk, J., Małek, E. 2004. Z materiałów do Słownika bibliograficznego języka rosyjskiego. Terminologia lingwistyczna. Wybrane terminy wiedzy o kulturze i literaturze. Neologizmy, hapaks legomena. Warszawa: Semiosis lexicographica.

Wierzchoń, P. 2005. Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzne. Scripta Neofilologica Posnaniensia VII, 221 - 239.

Wojnowski, J. (red.) 2003. Wielka encyklopedia PWN. Warszawa: PWN.

Woliński, M., Przepiórowski, M. 2001. Projekt anotacji morfosyntaktycznej korpusu języka polskiego. Raport Nr 938, Warszawa. http://www.ipipan.waw.pl/~wolinski/publ/ipi938.pdf

Vetulani, Z. 2004. Komunikacja człowieka z maszyną. Warszawa: Akademicka Oficyna Wydawnicza EXIT.

A3pmMH, A.H. 1999. Eojbmou 6yxemmepcKuu cjoeapb. MocKBa: HHcTHTyThobohskohomhkh.

anH3HflK, A.A. 1987. rpajMuamunecKuu cjoeapb pyccKozo n3UKa. MocKBa: PyccKHM a3mk.