Metoda wyodrębniania odtwarzalnych konstrukcji werbo-nominalnych języka rosyjskiego z korpusów tekstowych
PDF

Słowa kluczowe

corpus
morphological analysis
regular expressions
reproducibility
collocation

Jak cytować

Fedorushkov, Y., & Dzienisiewicz, D. (2019). Metoda wyodrębniania odtwarzalnych konstrukcji werbo-nominalnych języka rosyjskiego z korpusów tekstowych. Studia Rossica Posnaniensia, 44(2), 379–394. https://doi.org/10.14746/strp.2019.44.2.35

Abstrakt

The article describes an extraction method of Russian verbal-nominative structures from electronic texts with the use of grammatical annotation and regular expressions syntax. The stages of the retrieval process are outlined. The list of extracted structures can be subsequently verified for the presence of reproducible units (phrasems).
https://doi.org/10.14746/strp.2019.44.2.35
PDF

Bibliografia

Баранов А. Н., Добровольский Д. О. 2007. Словарь-тезаурус современной русской идиоматики: около 8 000 идиом современного русского языка, Москва: Мир энциклопедий Аванта+.

Виноградов В. В. 1977. Об основных типах фразеологических единиц в русском языке, [w:] В. В. Виноградов (red.). Избранные труды. Лексикология и лексикография, Москва: Наука, s. 140–161.

Зализняк А. А. 1987. Грамматический словарь русского языка: словоизменение: около 100,000 слов, Москва: Русский язык.

Захаров В., Хохлова М. 2014. Выделение терминологических словосочетаний из специальных текстов на основе различных мер ассоциации, [w:] Технологии информационного общества в науке, образовании и культуре: сборник научных статей. Труды XVII Всероссийской объединенной конференции „Интернет и современное общество” (IMS-2014), Санкт-Петербург, 19–20 ноября 2014 г., Санкт-Перетбург: НИУ ИТМО, s. 290–293.

Иорданаская Л. Н., Мельчук И. А. 2007. Смысл и сочетаемость в словаре, Москва: Языки славянских культур.

Ножов И. М. 2003. Морфологическая и синтаксическая обработка текста (модели и программы), źródło elektroniczne: http://www.aot.ru/docs/Nozhov/msot.pdf (dostęp 12.02.2019).

Ожегов С. И. 1974. Лексикология. Лексикография. Культура речи, Москва: Высшая школа.

Anusiewicz J. 1978. Konstrukcje analityczne we współczesnym języku polskim, Wrocław: Zakład Narodowy im. Ossolińskich.

Bogusławski A. 1978. Jednostki języka a produkty językowe. Problemy tzw. orzeczeń peryfrastycznych, [w:] M. Szymczak (red.), Z zagadnień współczesnego języka polskiego, Wrocław: Zakład Narodowy im. Ossolińskich.

Chlebda W. 2003. Elementy frazematyki. Wprowadzenie do frazeologii nadawcy, Łask: Leksem.

Chlebda W. (red.) 2010. Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, Opole: Wydawnictwo UO.

Chlebda W. (red.) 2011. Na tropach translatów – w poszukiwaniu odpowiedników przekładowych, Opole: Wydawnictwo UO.

Eder M. 2016. Słowa znaczące, słowa kluczowe, słowozbiory – o statystycznych metodach wyszukiwania wyrazów istotnych, „Przegląd Humanistyczny”, t. 3 (454), s. 31–44.

Fedorushkov Y. 2005. Automatyczna analiza morfologiczna jako narzędzie oceny poprawności wyrazów języka rosyjskiego, „Investigationes Linguisticae”, t. XII, s. 33–43.

Fedorushkov Y. 2007. Methods for electronic excerption of new words in Russian, [w:] B. Lewandowska-Tomaszczyk (red.), PALC 2007: Practical Applications in Language and Computers. Papers from the International Conference at the University of Łódź, 19–22 April 2007, Frankfurt am Main: Peter Lang Verlag, s. 163–186.

Fedorushkov Y. 2008. Metody ekscerpcji neologizmów języka rosyjskiego (na materiale współczesnej prasy rosyjskiej), praca doktorska, źródło elektroniczne: http://hdl.handle.net/10593/16715 (dostęp 12.02.2019).

Fedorushkov Y. 2009. Ekscerpcja wyrazów cudzysłowowych z tekstów prasy rosyjskiej, Warszawa: Wydawnictwo Takt.

Fedorushkov Y. 2010. Metody automatyzacji ekscerpcji konstrukcji atrybutywnych języka rosyjskiego, [w:] W. Chlebda (red.), Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, Opole: Wydawnictwo UO.

Fedorushkov Y., Szutkowski T. 2010. Лексико-грамматическая сочетаемость атрибутивных словосочетаний русского языка в контексте методов компьютерной эксцерпции, [w:] R. Guzmán Titado, L. Sokolova, I. Votyakova (red.), II Международная конференция „Русский язык и литература в международном образовательном пространстве: современное состояние и перспективы”, Гранада, 8–10 сентября 2010 г., t. II, Granada: Rubiños – 1860, S.A., s. 1565–1569.

Friedl J. E. F. 1997. Mastering regular expressions: powerful techniques for Perl and other tools, Cambridge – Köln – Paris – Sebastopol – Tokyo: O’Reilly & Associates Inc.

Jędrzejko, E. 1992. Słownictwo tzw. analityczne w opisie leksykalnym (propozycja opisu i klasyfikacji), [w:] A. Markowski (red.). Opisać słowa, Warszawa: Elipsa.

Lewicki A. M. 1976. Wprowadzenie do frazeologii syntaktycznej. Teoria zwrotu frazeologicznego, Katowice: Uniwersytet Śląski.

Loewe I. 2000. Konstrukcje analityczne w poezji Młodej Polski, Katowice: Wydawnictwo Uniwersytetu Śląskiego.

Wierzchoń P. 2002. Automatyzacja ekscerpcji definiowanych połączeń wyrazowych. Filtry wyrażeń regularnych, [w:] W. Krzemińska, P. Nowak (red.), Przestrzenie informacji, Poznań: Sorus, s. 119–184.

Wierzchoń P. 2005. Automatyczne metody ekscerpcji neologizmów, czyli słowotwórstwo faktograficzne, „Scripta Neophilologica Posnaniensia”, nr VII, s. 221–240.

Wierzchoń P. 2008a. Kotuś. „Verba Polona Abscondita...” (w fotodokumentacji). Szkic lingwochronologizacyjny. Centuria pierwsza, Poznań: Instytut Językoznawstwa Uniwersytetu im. Adama Mickiewicza.

Wierzchoń P. 2008b. Odtwarzalność w granicach pary przekładowej, „Przegląd Rusycystyczny”, nr 4, s. 111–139.

Wierzchoń P. 2010. Pięć bardzo skutecznych (sprawdzonych) sposobów na masowe wyodrębnianie wielowyrazowych segmentów podejrzanych o frazematyczność (czyli reproduktów), [w:] W. Chlebda (red.), Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, Opole: Wydawnictwo UO, s. 87–125.

Żmigrodzki P. 2000. Właściwości składniowe analitycznych konstrukcji werbo-nominalnych w języku polskim, Katowice: Wydawnictwo Uniwersytetu Śląskiego.