Abstract
The aim of this article is to present the basic capabilities of the Google search engine in the process of analysing multi-word lexical combinations. Our assumption is that the Google search engine can be regarded as a kind of linguistic database ready to be used as a practical linguistic tool. The text is an overview, therefore the presented material is limited to the necessary minimum, i.e. fifty randomly-selected phraseological compounds. In the introduction, we list ( and briefly discuss ) the tools available for studying Polish-language multi-word lexical combinations. With such an outlined background, we may characterise the Google search engine as a linguistic database. Finally, in the relevant part, we present the ways of using this tool with selected examples. In the summary, we discuss the possibilities offered by the use of a constantly-updated linguistic database which the Internet search engine under review can be considered to be.
References
Andrzejczuk Anna, Czupryniak Maciej ( 2008 ), O wykorzystaniu zasobów internetowych w pracy językoznawcy, "Polonica", t. 29, s. 189-204.
AntConc, https://tinyurl.com/59dec8fu [ dostęp: 10 listopada 2021 ].
Bąba Stanisław ( 1989 ), Innowacje frazeologiczne współczesnej polszczyzny, Poznań.
Bąba Stanisław ( 2009 ), Frazeologia polska. Studia i szkice, Poznań.
Bąba Stanisław ( 2012 ), Komentarze frazeograficzne, Poznań.
Chlebda Wojciech, red. ( 2010a ), Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, Opole.
Chlebda Wojciech ( 2010b ), Nieautomatyczne drogi dochodzenia do reproduktów wielowyrazowych, w: Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, red. Wojciech Chlebda, Opole, s. 15-35.
Chlebda Wojciech ( 2019 ), Frazeologia gatunkowa a leksykografia przekładowa. Wybrane problemy i przykłady, w: Perspektywy współczesnej frazeologii polskiej. Frazeologia w stylach i gatunkach mowy, red. Piotr Fliciński, Krzysztof Skibski, Poznań, s. 9-23.
Derwojedowa Magdalena ( 2017 ), Językoznawstwo komputerowe i inżynieria lingwistyczna po 1989 roku, "Język Polski", z. 1, s. 7-17.
Dziamska-Lenart Gabriela ( 2004 ), Innowacje frazeologiczne w powojennej felietonistyce polskiej, Poznań.
Fiedoruszkow Jurij ( 2010 ), Metody automatyzacji ekscerpcji konstrukcji atrybutywnych języka rosyjskiego, w: Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, red. Wojciech Chlebda, Opole, s. 47-58.
Fliciński Piotr ( 2009a ), Przestrzeń telematyczna jako biblioteka, archiwum i kartoteka podręczna frazeografa, w: Tekst ( w ) sieci, t. 2: Tekst. Język. Gatunki, red. Danuta Ulicka, Warszawa, s. 151-159.
Fliciński Piotr ( 2009b ), Wielokształtność związków idiomatycznych a norma frazeologiczna ( na marginesie projektu indeksu "rozgałęzionego" FRAZIR ), w: Kształtowanie się wzorów i wzorców językowych, red. Anna Piotrowicz, Krzysztof Skibski, Michał Szczyszek, Poznań, s. 163-173.
Fliciński Piotr ( 2013 ), Frazeologiczny indeks rozgałęziony jako środowisko badań nad wielokształtnością związków idiomatycznych, w: Perspektywy współczesnej frazeologii polskiej. Między teorią a praktyką frazeograficzną, red. Gabriela Dziamska-Lenart, Jarosław Liberek, Poznań, s. 63-80.
Gębka-Wolak Małgorzata, Moroz Andrzej ( 2016 ), Zinformatyzowane procedury oceny poprawności wyrażeń językowych, w: Donum amicitiae. Księga jubileuszowa ofiarowana Pani Profesor Ewie Kołodziejek, red. Jolanta Ignatowicz-Skowrońska, Rafał Sidorowicz, Szczecin, s. 33-47.
Grabowski Łukasz ( 2010 ), Korpusy w pracy idiomatykarzy - wybrane studia przypadku na przykładzie Narodowego Korpusu Języka Rosyjskiego, w: Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, red. Wojciech Chlebda, Opole, s. 47-58.
Graliński Filip, Dzienisiewicz Daniel, Wierzchoń Piotr ( 2017 ), U bram lingwistycznej szczęśliwości, czyli kulisy projektu Odkrywka: cyfrowe zasoby kultury jako źródło mas danych językowych, "Annales Universitatis Paedagogicae Cracoviensis. Studia Sociologica", t. 1, s. 51-62.
Graliński Filip, Liberek Jarosław, Wierzchoń Piotr ( 2018 ), Badania nad współczesnym uzusem i jego ewolucją w świetle danych gromadzonych metodami lingwistyki komputerowej. Na wybranych przykładach z zakresu morfologii, składni i leksyki, w: Wybrane aspekty badań nad normą językową, red. Piotr Zbróg, Kraków, s. 49-85.
Graliński Filip, Wierzchoń Piotr ( 2018 ), Odkrywka, czyli leksykografia diachroniczna live, w: Między teorią a praktyką. Metody współczesnej leksykografii, t. 1, red. Mirosław Bańko, Halina Karaś, Warszawa, s. 59-70. DOI: https://doi.org/10.31338/uw.9788323535492. pp.59-70.
Hwaszcz Krzysztof ( 2020a ), Instrukcja korzystania z wyszukiwarki korpusowej KonText z lekcjami i ćwiczeniami, https://tinyurl.com/mr2y98cr [ dostęp: 10 listopada 2021 ].
Hwaszcz Krzysztof ( 2020b ), TermoPL. Instrukcja użytkowania, https://tinyurl.com/56zpunbh [ dostęp: 10 listopada 2021 ].
Ignatowicz-Skowrońska Jolanta ( 2008 ), Frazeologizmy jako tworzywo stylu współczesnej powieści polskiej, Szczecin.
Ignatowicz-Skowrońska Jolanta ( 2020 ), Frazeologiczne innowacje uzupełniające współczesnej polszczyzny. Studia, Szczecin.
Język zapytań Narodowego Korpusu Języka Polskiego, https://tinyurl.com/y9rb9t39 [ dostęp: 10 listopada 2021 ].
Kosek Iwona ( 2008 ), Fleksja i składnia nieciągłych imiennych jednostek leksykalnych, Olsztyn.
Kosek Iwona ( 2011 ), Wariantywność zwrotów frazeologicznych a granice jednostki leksykalnej, w: Perspektywy współczesnej frazeologii. Wariantywność we frazeologii, red. Piotr Fliciński, Poznań, s. 9-22.
Kosek Iwona ( 2013 ), Paradygmaty zwrotów frazeologicznych - problemy opisu leksykograficznego, w: Perspektywy współczesnej frazeologii polskiej. Między teorią a praktyką frazeograficzną, red. Gabriela Dziamska-Lenart, Jarosław Liberek, Poznań, s. 51-61.
Kozioł-Chrzanowska Ewa ( 2018 ), Grafika Google - możliwości i ograniczenia narzędzia jako źródła informacji dla leksykografów redagujących definicje słownikowe, w: Między teorią a praktyką. Metody współczesnej leksykografii, t. 1, red. Mirosław Bańko, Halina Karaś, Warszawa, s. 113-128. https://doi.org/10.31338/uw.9788323535492.pp.113-128
Królczyk Jakub ( 2015 ), Błędy programu do obróbki korpusu, podczas badań korpusowych słownictwa biznesowego i prawnego w języku wietnamskim, na przykładzie programu AntConc, "Investigationes Linguisticae", nr 31, s. 5-17. DOI: https://doi.org/10.14746/il.2014.31.2
Łukasik Marek ( 2007 ), Narzędzia lingwistyki korpusowej w warsztacie terminologa, terminografa i tłumacza tekstów specjalistycznych, w: Debiuty Naukowe 1. Wiedza - korpus - słownik, red. Marek Łukasik, Warszawa, s. 23-47.
Majkowska Grażyna ( 1988 ), Klasyfikacja semantyczna zamierzonych modyfikacji związków frazeologicznych, w: Z problemów frazeologii polskiej i słowiańskiej V, red. Mieczysław Basaj, Danuta Rytel, Wrocław, s. 143-163.
Narodowy Fotokorpus Języka Polskiego, https://nfjp.pl/ [ dostęp: 10 listopada 2021 ].
Narodowy Korpus Języka Polskiego, http://nkjp.pl/ [ dostęp: 10 listopada 2021 ].
Ogrodniczuk Maciej ( 2017 ), Lingwistyka komputerowa dla języka polskiego: dziś i jutro, "Język Polski", z. 1, s. 18-28.
Pajdzińska Anna ( 1993 ), Frazeologizmy jako tworzywo współczesnej poezji, Lublin.
Pęzik Piotr ( 2012 ), Wyszukiwarka PELCRA dla danych NKJP, w: Narodowy Korpus Języka Polskiego, red. Adam Przepiórkowski, Mirosław Bańko, Rafał Górski, Barbara Lewandowska-Tomaszczyk, Warszawa, s. 253-273.
Piotrowski Mariusz ( 2014 ), Instrukcja użytkowania programu AntConc dla korpusów tekstowych języka polskiego, https://tinyurl.com/y6ty9ms4 [ dostęp: 10 listopada 2021 ].
Podhajecka Mirosława ( 2018 ), Google Books jako korpus językowy, "Biuletyn Polskiego Towarzystwa Językoznawczego", z. 74, s. 31-46. https://doi.org/10.17651/bptj.74.2
Przeszukiwanie Wyszukiwarki korpusowej Monco, http://monco.frazeo.pl/help# [ dostęp: 10 listopada 2021 ].
TermoPL, https://tinyurl.com/27jbfwwd [ dostęp: 10 listopada 2021 ].
Świdziński Marek ( 2006 ), Lingwistyka korpusowa w Polsce - źródła, stan, perspektywy, "LingVaria", nr 1, s. 23-32.
Waliński Jacek ( 2005 ), Typologia korpusów oraz warsztat informatyczny lingwistyki korpusowej, w: Podstawy językoznawstwa korpusowego, red. Barbara Lewandowska-Tomaszczyk, Łódź, s. 27-33.
Wierzchoń Piotr ( 2010 ), Pięć bardzo skutecznych ( sprawdzonych ) sposobów na masowe wyodrębnianie wielowyrazowych segmentów podejrzanych o frazematyczność ( czyli reproduktów ), w: Na tropach reproduktów. W poszukiwaniu wielowyrazowych jednostek języka, red. Wojciech Chlebda, Opole, s. 87-125.
Wierzchoń Piotr, Jankowski Michał, Borchman Łukasz ( 2015 ), Fotosuplement do "Słownika warszawskiego". Indeks a tergo, Warszawa.
Wyszukiwarka kontekstowa KonText, https://tinyurl.com/ycksj3w7 [ dostęp: 10 listopada 2021 ].
Wyszukiwarka korpusowa Monco, http://monco.frazeo.pl/ [ dostęp: 10 listopada 2021 ].
Wiśniewiecka-Brückner Katarzyna ( 2016 ), Zmiana - ewolucja - rewolucja. O języku, normie i metodach na przykładzie rekcji dopełniaczowej czasownika polskiego, "Rozprawy Komisji Językowej ŁTN", t. 62, s. 191-202.
Woźniak Michał ( 2017 ), Jak znaleźć igłę w stogu siana? Automatyczna ekstrakcja wielosegmentowych jednostek leksykalnych z tekstu polskiego, Kraków.
License
Authors
Authors of texts accepted for publication in „Poznańskie Studia Polonistyczne. Seria Językoznawcza” are required to complete, sign and return to the editor's office the Agreement for granting a royalty-free license to works with a commitment to grant a CC sub-license.
Under the agreement, the authors of texts published in „Poznańskie Studia Polonistyczne. Seria Językoznawcza” grant the Adam Mickiewicz University in Poznań a non-exclusive, royalty-free license and authorize the use of Attribution-NoDerivatives 4.0 International (CC BY-ND 4.0) Creative Commons sub-license.
The authors retain the right to continue the free disposal of the work.
Users
Interested Internet users are entitled to use works published in „Poznańskie Studia Polonistyczne. Seria Językoznawcza” since 2016 under the following conditions:
- attribution - obligation to provide, together with the distributed work, information about the authorship, title, source (link to the original work, DOI) and the license itself.
- no derivatives - the work must be preserved in its original form, without the author's consent it is not possible to distribute the modified work, such as translations, publications, etc.
Copyrights are reserved for all texts published before 2016.
Miscellaneous
Adam Mickiewicz University in Poznań retains the right to magazines as a whole (layout, graphic form, title, cover design, logo etc.).