Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzne

Main Article Content

Piotr Wierzchoń

Abstrakt

Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzne

Downloads

Download data is not yet available.

Article Details

Jak cytować
Wierzchoń, P. (2018). Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzne. Scripta Neophilologica Posnaniensia, (7), 221-240. https://doi.org/10.14746/snp.2005.07.14
Dział
Językoznawstwo
Biogram autora

Piotr Wierzchoń, Uniwersytet im. Adama Mickiewicza w Poznaniu

doktor habilitowany, polonista, językoznawca ogólny, adiunkt w Zakładzie Językoznawstwa Ogólnego i Porównawczego w Instytucie Językoznawstwa UAM

Bibliografia

 1. Aarts, J., Meijs, W. (red.). 1984. Corpus Linguistics: Proceedings of the ICAME 4th International Conference on the Use of Computer Corpora in English Language Research. Amsterdam: Rodopi Bv Editions.
 2. Bańko, M. 2001. Z pogranicza leksykografii i językoznawstwa. Studia o słowniku jednojęzycznym. Warszawa: Wydział Polonistyki Uniwersytetu Warszawskiego.
 3. Bańko, M. 2002. Wykłady z fleksji polskiej. Warszawa: PWN.
 4. Baroni, M., Matiasek, J., Trost, H. 2002. Unsupervised discovery of morphologically related words based on orthographic and semantic similarity. Proceedings of the Workshop on Morphological and Phonological Learning of ACL/SIGPHON-2002, 48 – 57.
 5. Bień, J.S., Szafran, K. 1996. Analiza języka polskiego w Instytucie Informatyki UW. W: Vetulani, Z. et al. (red.). 1996, 77 – 81.
 6. Bień, J.S., Szafran, K. 2001. Analiza morfologiczna języka polskiego w praktyce. Biuletyn Polskiego Towarzystwa Językoznawczego LVII, 171 – 184.
 7. Buttler, D. 1962. Neologizm i terminy pokrewne. Poradnik Językowy 5 – 6, 235 – 244.
 8. Čermák, F. 2001. Substance of Idioms: perennial problems, lack of data or theory? International Journal of Lexicography 14, 1 – 20.
 9. Daciuk, J. 1999. A Module for Treatment of Unknown Words. Speech and Language Technology 3, 165 – 169.
 10. Degand, L., Bestgen, Y. 2003. Towards Automatic Retrieval of Idioms in French Newspaper Corpora. Literary and Linguistic Computing 18 (3), 249 – 259.
 11. Gajda, S. (red.). 2001. Język polski. Opole: UO, IFP.
 12. Gajda, S. (red.). 2003. Językoznawstwo w Polsce. Stan i perspektywy. Opole: UO.
 13. Gilquin, G. 2002. Automatic retrieval of syntactic structures: The quest for the Holy Grail. International Journal of Corpus Linguistics 7 (2), 183 – 214.
 14. Goldsmith, J. 2001. Unsupervised Learning of the Morphology of a Natural Language. Computational Linguistics 27, 153 – 198.
 15. Graliński, F. 1998. Realizacja półautomatycznej ekstrakcji leksemów występujących w korpusie polskich tekstów informatycznych. Speech and Language Technology 2, 127 – 135.
 16. Graliński, F., Krynicki, G. 2000. Word-Formation Analysis in Polish-to-English Machine Translation. Speech and Language Technology 4, 185 – 203.
 17. Han, Chung-hye, Han, Na-Rae, Ko, Eon-Suk, Palmer, M. 2002. Development and Evaluation of a Korean Treebank and its Application to NLP. Language and Information 6 (1), 123 – 138.
 18. Jadacka, H. 2001. System słowotwórczy polszczyzny (1945 – 2000). Warszawa: PWN.
 19. Jones, S., Sinclair, J.M. 1974. English lexical collocations. Cahiers de Lexicologie 24, 15 – 61.
 20. Kaalep, H-J. 1997. An Estonian Morphological Analyser and the Impact of a Corpus on Its Development. Computers and the Humanities 31, 115 – 133.
 21. Kang, Seung-Shik, Kim, Yung Taek. 1994. Syllable-based Model for the Korean Morphology. COLING 1994: The 15th International Conference on Computational Linguistics 1, 221 – 226.
 22. Kiefer, F., Kiss, G., Pajzs, J. (red.). 1992. Papers in Computational Lexicography. Complex-92. Budapest: Hungarian Academy of Sciences, Linguistics Institute.
 23. Koval, S., Beliaeva, L., Kogan, L., Mikhailov, A., Nilolaev, V., Piotrowski, R., Tomach, Y. 2000. Morphological representation in PC-based text processing systems. Literary and Linguistic Computing 15 (2), 131 – 156.
 24. Kučera, K. 2002. The Czech National Corpus: Principles, Design, and Results. Literary and Linguistic Computing 17 (2), 245 – 257.
 25. Kuraszkiewicz, W. 1973. Obfitość słownictwa w kilku dużych tekstach polskich. Studia Polonistyczne I, 45 – 63.
 26. Kurcz, I. 1973. Założenia ogólne frekwencyjnych badań nad słownictwem i cele, którym te badania służą. Przegląd Pedagogiczny 1 – 2, 65 – 75.
 27. Kurkowska, H. 1956. O nowym słownictwie polskim. Warszawa: Wiedza Powszechna.
 28. Kwon, Oh-Wook, Park, Jun. 2003. Korean large vocabulary continuous speech recognition with morpheme-based recognition units. Speech Communication 39, 287 – 300.
 29. Lee, Do-Gil, Rim, Hae-Chang, Lim, Heui-Seok. 2003. A Syllable Based Word Recognition Model for Korean Noun Extraction. Proceedings of the 41st Annual Meeting of the Association for Computational Linguistics, 471 – 478.
 30. Lee, Gary Geunbae, Cha, Jeongwon, Lee, Jong-Hyeok. 2002. Syllable-Pattern-Based Unknown-Morpheme Segmentation and Estimation for Hybrid Part-of-Speech Tagging of Korean. Computational Linguistics 28 (1), 53 – 70.
 31. Lubaś, W., Sowa, F. (red.). 1993. Wokół słownika współczesnego języka polskiego. III. Zakres selekcji i informacji. Kraków: IJP PAN.
 32. Mańczak, W. 1959. Pojęcie ilości w języku. Studia Filozoficzne 60, 111 – 127.
 33. Mikheev, A. 2002. Periods, Capitalized Words, etc. Computational Linguistics 28 (3), 289 – 318.
 34. Nagórko-Kufel, A. 1978. Statystyczna struktura słownictwa motywowanego. Poradnik Językowy 3, 99 – 105.
 35. Obrębski, T. 1998. Wykorzystanie lematyzatora słownika POLEX do oznaczania form wyrazowych w korpusie tekstów informatycznych. Speech and Language Technology 2, 113 – 126.
 36. Oflazer, K. 1996. Error-tolerant finite state recognition with applications to morphological analysis and spelling correction. Computational Linguistics 22 (1), 73 – 89.
 37. Park, Bong-Rae, Hwang, Young-Sook, Rim, Hae-Chang. 1997. Recognizing Korean Unknown Words by Comparatively Analyzing Example Words. Proceedings of the 1997 International Conference on Computer Processing of Oriental Languages, 127 – 132.
 38. Park, Bong-Rae, Hwang, Young-Sook, Rim, Hae-Chang. 1998. Eliminating Implausible Korean Morphological Interpretations by Using History of Previous Analysis and Lexical Association. Proceedings of the 5th Pacific Rim International Conference on Artificial Intelligence, 31 – 36.
 39. Pawłowski, A. 2003. Uwagi na temat korpusu języka polskiego (reprezentatywność, aktualność, nazwa). W: Gajda, S. (red.). 2003, 162 – 180.
 40. Proszeky, G., Tihanyi, L. 1992. A Fast Morphological Analyzer for Lemmatizing Agglutinative Languages. W: Kiefer, F. et al. (red.). 1992, 265 – 278.
 41. Saloni, Z. 1992. Co istnieje, a co nie istnieje we fleksji polskiej. Prace Filologiczne XXXVII, 75 – 87.
 42. Sambor, J. 1975. O słownictwie statystycznie rzadkim (na materiale derywatów we współczesnej publicystyce polskiej). Warszawa: PWN.
 43. Sgarbas, K.N., Fakotakis, N.K., Kokkinakis, G.K. 1998. A PC-KIMMO-based Bi-directional Graphemic/phonetic Converter for Modern Greek. Literary and Linguistic Computing 13 (2), 65 – 76.
 44. Sgarbas, K.N., Londos, G.E., Fakotakis, N.D., Kokkinakis. G.K. 2003. The WATCHER Project: Building an Agent for Automatic Extraction of Language Resources from the Internet. Literary and Linguistic Computing 18, 449 – 464.
 45. Sharma, U., Kalita, J., Das, R. 2002. Unsupervised Learning of Morphology for Building Lexicon for a Highly Inflectional Language. Proceedings of the Workshop on Morphological and Phonological Learning of ACL/SIGPHON-2002, 1 – 10.
 46. Sinclair, J.M. 1992. The automatic analysis of corpora. W: Svartvik, J. (red.). 1992, 379 – 397.
 47. Smith, G.W. 1991. Computers and Human Language. New York – Oxford: Oxford University Press.
 48. Smółkowa, T. 2001. Neologizmy we współczesnej leksyce polskiej. Kraków: IJP PAN.
 49. Solak, A., Oflazer, K. 1993. Design and Implementation of a Spelling Checker for Turkish. Literary and Linguistic Computing 8 (3), 113 – 130.
 50. Stoberski, Z. 1976. O centralną rejestrację neologizmów naukowych. Poradnik Językowy 4, 186 – 189.
 51. Stubbs, M. 1996. Text and Corpus Analysis. Oxford: Blackwell.
 52. Stubbs, M. 2002. Two quantitative methods of studying phraseology in English. International Journal of Corpus Linguistics 7 (2), 215 – 244.
 53. Suszczańska, N., Forczek, M., Migas, A. 2000. Wieloetapowy analizator morfologiczny. Speech and Language Technology 4, 55 – 65.
 54. Svartvik, J. (red.). 1992. Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82. Stockholm, 4 – 8 August 1991. Berlin: Mouton de Gruyter.
 55. Szafran, K. 1993. Automatyczna analiza fleksyjna tekstu polskiego (na podstawie Schematycznego indeksu a tergo Jana Tokarskiego). Uniwersytet Warszawski. Wydział Polonistyki. Niepublikowana praca doktorska.
 56. Tambouratzis, G., Carayannis, G. 2001. Automatic Corpora-based Stemming in Greek. Literary and Linguistic Computing 16 (4), 445 – 466.
 57. Teahan, W.J., Wen, Y., McNab, R., Witten, I.H. 2000. A Compression-based Algorithm for Chinese Word Segmentation. Computational Linguistics 26 (3), 375 – 393.
 58. Waszakowa, K. 1997. Rola kontekstu i sytuacji w rozumieniu neologizmów. Biuletyn Polskiego Towarzystwa Językoznawczego 53, 121 – 132.
 59. Waszakowa, K. 2001. System słowotwórczy. W: Gajda, S. (red.). 2001, 88 – 107.
 60. Wawrzyńczyk, J. 1992. Chronologizacja słownictwa nowopolskiego. W poszukiwaniu źródeł dokumentacyjnych neologizmów powojennych. Toruń: UMK.
 61. Wawrzyńczyk, J. 1993. Uwagi o rejestracji neologizmów polszczyzny dwudziestowiecznej. W: Lubaś, W., Sowa, F. (red.). 1993, 33 – 40.
 62. Wawrzyńczyk, J. 2000. Słownik bibliograficzny języka polskiego: wersja przedelektroniczna. T.1, A-Ć. Warszawa: Warszawa: Instytut Informacji Naukowej i Studiów Bibliologicznych Uniwersytetu Warszawskiego.
 63. Wołosz, R. 2000. Efektywna metoda analizy i syntezy morfologicznej w języku polskim. Uniwersytet Warszawski.
 64. Wydział Polonistyki. Niepublikowana rozprawa doktorska.
 65. Wypych, M. 2002. Stochastic Spelling Correction of Texts in Polish. Speech and Language Technology 6, 243 – 250.
 66. Vetulani, Z., Walczak, B., Obrębski, T., Vetulani, G. 1998. Jednoznaczne kodowanie fleksji rzeczownika i jego zastosowanie w słownikach elektronicznych – format POLEX. Poznań: Wydawnictwo Naukowe UAM.
 67. Yamamoto, M., Church, K.W. 2001. Using Suffix Arrays to Compute Term Frequency and Document Frequency for all Substrings in a Corpus. Computational Linguistics 27 (1), 1 – 30.
 68. Yoon, J. 2001. Efficient dependency analysis for Korean sentences based on lexical association and multi-layered chunking. Literary and Linguistic Computing 16 (3), 265 – 285.
 69. Zagrodnikowa, A. 1982. Nowe wyrazy i wyrażenia w prasie. Kraków: OBP.