Abstrakt
Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzneBibliografia
Aarts, J., Meijs, W. (red.). 1984. Corpus Linguistics: Proceedings of the ICAME 4th International Conference on the Use of Computer Corpora in English Language Research. Amsterdam: Rodopi Bv Editions.
Bańko, M. 2001. Z pogranicza leksykografii i językoznawstwa. Studia o słowniku jednojęzycznym. Warszawa: Wydział Polonistyki Uniwersytetu Warszawskiego.
Bańko, M. 2002. Wykłady z fleksji polskiej. Warszawa: PWN.
Baroni, M., Matiasek, J., Trost, H. 2002. Unsupervised discovery of morphologically related words based on orthographic and semantic similarity. Proceedings of the Workshop on Morphological and Phonological Learning of ACL/SIGPHON-2002, 48 – 57.
Bień, J.S., Szafran, K. 1996. Analiza języka polskiego w Instytucie Informatyki UW. W: Vetulani, Z. et al. (red.). 1996, 77 – 81.
Bień, J.S., Szafran, K. 2001. Analiza morfologiczna języka polskiego w praktyce. Biuletyn Polskiego Towarzystwa Językoznawczego LVII, 171 – 184.
Buttler, D. 1962. Neologizm i terminy pokrewne. Poradnik Językowy 5 – 6, 235 – 244.
Čermák, F. 2001. Substance of Idioms: perennial problems, lack of data or theory? International Journal of Lexicography 14, 1 – 20.
Daciuk, J. 1999. A Module for Treatment of Unknown Words. Speech and Language Technology 3, 165 – 169.
Degand, L., Bestgen, Y. 2003. Towards Automatic Retrieval of Idioms in French Newspaper Corpora. Literary and Linguistic Computing 18 (3), 249 – 259.
Gajda, S. (red.). 2001. Język polski. Opole: UO, IFP.
Gajda, S. (red.). 2003. Językoznawstwo w Polsce. Stan i perspektywy. Opole: UO.
Gilquin, G. 2002. Automatic retrieval of syntactic structures: The quest for the Holy Grail. International Journal of Corpus Linguistics 7 (2), 183 – 214.
Goldsmith, J. 2001. Unsupervised Learning of the Morphology of a Natural Language. Computational Linguistics 27, 153 – 198.
Graliński, F. 1998. Realizacja półautomatycznej ekstrakcji leksemów występujących w korpusie polskich tekstów informatycznych. Speech and Language Technology 2, 127 – 135.
Graliński, F., Krynicki, G. 2000. Word-Formation Analysis in Polish-to-English Machine Translation. Speech and Language Technology 4, 185 – 203.
Han, Chung-hye, Han, Na-Rae, Ko, Eon-Suk, Palmer, M. 2002. Development and Evaluation of a Korean Treebank and its Application to NLP. Language and Information 6 (1), 123 – 138.
Jadacka, H. 2001. System słowotwórczy polszczyzny (1945 – 2000). Warszawa: PWN.
Jones, S., Sinclair, J.M. 1974. English lexical collocations. Cahiers de Lexicologie 24, 15 – 61.
Kaalep, H-J. 1997. An Estonian Morphological Analyser and the Impact of a Corpus on Its Development. Computers and the Humanities 31, 115 – 133.
Kang, Seung-Shik, Kim, Yung Taek. 1994. Syllable-based Model for the Korean Morphology. COLING 1994: The 15th International Conference on Computational Linguistics 1, 221 – 226.
Kiefer, F., Kiss, G., Pajzs, J. (red.). 1992. Papers in Computational Lexicography. Complex-92. Budapest: Hungarian Academy of Sciences, Linguistics Institute.
Koval, S., Beliaeva, L., Kogan, L., Mikhailov, A., Nilolaev, V., Piotrowski, R., Tomach, Y. 2000. Morphological representation in PC-based text processing systems. Literary and Linguistic Computing 15 (2), 131 – 156.
Kučera, K. 2002. The Czech National Corpus: Principles, Design, and Results. Literary and Linguistic Computing 17 (2), 245 – 257.
Kuraszkiewicz, W. 1973. Obfitość słownictwa w kilku dużych tekstach polskich. Studia Polonistyczne I, 45 – 63.
Kurcz, I. 1973. Założenia ogólne frekwencyjnych badań nad słownictwem i cele, którym te badania służą. Przegląd Pedagogiczny 1 – 2, 65 – 75.
Kurkowska, H. 1956. O nowym słownictwie polskim. Warszawa: Wiedza Powszechna.
Kwon, Oh-Wook, Park, Jun. 2003. Korean large vocabulary continuous speech recognition with morpheme-based recognition units. Speech Communication 39, 287 – 300.
Lee, Do-Gil, Rim, Hae-Chang, Lim, Heui-Seok. 2003. A Syllable Based Word Recognition Model for Korean Noun Extraction. Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics, 471 – 478.
Lee, Gary Geunbae, Cha, Jeongwon, Lee, Jong-Hyeok. 2002. Syllable-Pattern-Based Unknown-Morpheme Segmentation and Estimation for Hybrid Part-of-Speech Tagging of Korean. Computational Linguistics 28 (1), 53 – 70.
Lubaś, W., Sowa, F. (red.). 1993. Wokół słownika współczesnego języka polskiego. III. Zakres selekcji i informacji. Kraków: IJP PAN.
Mańczak, W. 1959. Pojęcie ilości w języku. Studia Filozoficzne 60, 111 – 127.
Mikheev, A. 2002. Periods, Capitalized Words, etc. Computational Linguistics 28 (3), 289 – 318.
Nagórko-Kufel, A. 1978. Statystyczna struktura słownictwa motywowanego. Poradnik Językowy 3, 99 – 105.
Obrębski, T. 1998. Wykorzystanie lematyzatora słownika POLEX do oznaczania form wyrazowych w korpusie tekstów informatycznych. Speech and Language Technology 2, 113 – 126.
Oflazer, K. 1996. Error-tolerant finite state recognition with applications to morphological analysis and spelling correction. Computational Linguistics 22 (1), 73 – 89.
Park, Bong-Rae, Hwang, Young-Sook, Rim, Hae-Chang. 1997. Recognizing Korean Unknown Words by Comparatively Analyzing Example Words. Proceedings of the 1997 International Conference on Computer Processing of Oriental Languages, 127 – 132.
Park, Bong-Rae, Hwang, Young-Sook, Rim, Hae-Chang. 1998. Eliminating Implausible Korean Morphological Interpretations by Using History of Previous Analysis and Lexical Association. Proceedings of the 5th Pacific Rim International Conference on Artificial Intelligence, 31 – 36.
Pawłowski, A. 2003. Uwagi na temat korpusu języka polskiego (reprezentatywność, aktualność, nazwa). W: Gajda, S. (red.). 2003, 162 – 180.
Proszeky, G., Tihanyi, L. 1992. A Fast Morphological Analyzer for Lemmatizing Agglutinative Languages. W: Kiefer, F. et al. (red.). 1992, 265 – 278.
Saloni, Z. 1992. Co istnieje, a co nie istnieje we fleksji polskiej. Prace Filologiczne XXXVII, 75 – 87.
Sambor, J. 1975. O słownictwie statystycznie rzadkim (na materiale derywatów we współczesnej publicystyce polskiej). Warszawa: PWN.
Sgarbas, K.N., Fakotakis, N.K., Kokkinakis, G.K. 1998. A PC-KIMMO-based Bi-directional Graphemic/phonetic Converter for Modern Greek. Literary and Linguistic Computing 13 (2), 65 – 76.
Sgarbas, K.N., Londos, G.E., Fakotakis, N.D., Kokkinakis. G.K. 2003. The WATCHER Project: Building an Agent for Automatic Extraction of Language Resources from the Internet. Literary and Linguistic Computing 18, 449 – 464.
Sharma, U., Kalita, J., Das, R. 2002. Unsupervised Learning of Morphology for Building Lexicon for a Highly Inflectional Language. Proceedings of the Workshop on Morphological and Phonological Learning of ACL/SIGPHON-2002, 1 – 10.
Sinclair, J.M. 1992. The automatic analysis of corpora. W: Svartvik, J. (red.). 1992, 379 – 397.
Smith, G.W. 1991. Computers and Human Language. New York – Oxford: Oxford University Press.
Smółkowa, T. 2001. Neologizmy we współczesnej leksyce polskiej. Kraków: IJP PAN.
Solak, A., Oflazer, K. 1993. Design and Implementation of a Spelling Checker for Turkish. Literary and Linguistic Computing 8 (3), 113 – 130.
Stoberski, Z. 1976. O centralną rejestrację neologizmów naukowych. Poradnik Językowy 4, 186 – 189.
Stubbs, M. 1996. Text and Corpus Analysis. Oxford: Blackwell.
Stubbs, M. 2002. Two quantitative methods of studying phraseology in English. International Journal of Corpus Linguistics 7 (2), 215 – 244.
Suszczańska, N., Forczek, M., Migas, A. 2000. Wieloetapowy analizator morfologiczny. Speech and Language Technology 4, 55 – 65.
Svartvik, J. (red.). 1992. Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82. Stockholm, 4 – 8 August 1991. Berlin: Mouton de Gruyter.
Szafran, K. 1993. Automatyczna analiza fleksyjna tekstu polskiego (na podstawie Schematycznego indeksu a tergo Jana Tokarskiego). Uniwersytet Warszawski. Wydział Polonistyki. Niepublikowana praca doktorska.
Tambouratzis, G., Carayannis, G. 2001. Automatic Corpora-based Stemming in Greek. Literary and Linguistic Computing 16 (4), 445 – 466.
Teahan, W.J., Wen, Y., McNab, R., Witten, I.H. 2000. A Compression-based Algorithm for Chinese Word Segmentation. Computational Linguistics 26 (3), 375 – 393.
Waszakowa, K. 1997. Rola kontekstu i sytuacji w rozumieniu neologizmów. Biuletyn Polskiego Towarzystwa Językoznawczego 53, 121 – 132.
Waszakowa, K. 2001. System słowotwórczy. W: Gajda, S. (red.). 2001, 88 – 107.
Wawrzyńczyk, J. 1992. Chronologizacja słownictwa nowopolskiego. W poszukiwaniu źródeł dokumentacyjnych neologizmów powojennych. Toruń: UMK.
Wawrzyńczyk, J. 1993. Uwagi o rejestracji neologizmów polszczyzny dwudziestowiecznej. W: Lubaś, W., Sowa, F. (red.). 1993, 33 – 40.
Wawrzyńczyk, J. 2000. Słownik bibliograficzny języka polskiego: wersja przedelektroniczna. T.1, A-Ć. Warszawa: Warszawa: Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytetu Warszawskiego.
Wołosz, R. 2000. Efektywna metoda analizy i syntezy morfologicznej w języku polskim. Uniwersytet Warszawski.
Wydział Polonistyki. Niepublikowana rozprawa doktorska.
Wypych, M. 2002. Stochastic Spelling Correction of Texts in Polish. Speech and Language Technology 6, 243 – 250.
Vetulani, Z., Walczak, B., Obrębski, T., Vetulani, G. 1998. Jednoznaczne kodowanie fleksji rzeczownika i jego zastosowanie w słownikach elektronicznych – format POLEX. Poznań: Wydawnictwo Naukowe UAM.
Yamamoto, M., Church, K.W. 2001. Using Suffix Arrays to Compute Term Frequency and Document Frequency for all Substrings in a Corpus. Computational Linguistics 27 (1), 1 – 30.
Yoon, J. 2001. Efficient dependency analysis for Korean sentences based on lexical association and multi-layered chunking. Literary and Linguistic Computing 16 (3), 265 – 285.
Zagrodnikowa, A. 1982. Nowe wyrazy i wyrażenia w prasie. Kraków: OBP.