Far Beyond Google Translate: Natural Language Processing (NLP) in Translation and Translatology

Main Article Content

Inez Okulska

Abstract

The more technological development, the greater the participation of the human – in formulating tasks and problems, supervising and improving automated processes and interpreting their outcomes. The hierarchy is preserved, humans are still indispensable, but it does not mean that in certain areas of machinery the potential does not really exceed that of the human and that this advantage is not worth exploiting. Natural language processing (NLP) is not a young field, but in recent years, thanks to the thrive of deep learning methods, data and knowledge mining or new human-machine interfaces, computer text analysis is experiencing a real renaissance. As far as translation is concerned, it is mostly algorithms for machine translation that are being discussed. This article, on the other hand, presents a slightly broader spectrum of the translation process and looks at the accompanying elements (such as criticism) in which the use of NLP methods may bring new and interesting results. Results which, due to limited computing power, humans are unable to achieve. The discussion in the paper covers such aspects as the vector representation of language,stylometry and its application, or the analysis of large data sets – all for the purposes of translation and translatology.

Downloads

Download data is not yet available.

Article Details

How to Cite
Okulska, I. (2020). Far Beyond Google Translate: Natural Language Processing (NLP) in Translation and Translatology. Porównania, 26(1), 283-297. https://doi.org/10.14746/por.2020.1.16
Section
Articles
Author Biography

Inez Okulska, Uniwersytet im. Adama Mickiewicza w Poznaniu

doktor nauk humanistycznych w zakresie literaturoznawstwa. Po przejściu barwnej ścieżki humanistycznej (na którą składały się m.in. lingwistyka, kulturoznawstwo, filozofia) zakończonej podoktorskim stażem na Harvard University (Wydział Komparatystyki Literackiej), ukończyła studia magisterskie na Automatyce i Robotyce Politechniki Warszawskiej. Metody sztucznej inteligencji, a w szczególności metody przetwarzania języka naturalnego, którymi obecnie zajmuje się naukowo w Państwowym Instytucie Badawczym NASK, doskonale łączą te, odległe zdawałoby się, dziedziny. Zwłaszcza że najchętniej aplikuje je właśnie do analizy materiału literackiego.

References

  1. Benjamin, Walter. „Zadanie tłumacza”. Przeł. Adam Lipszyc. Literatura na Świecie 5-6 (2011). S. 27-41.
  2. Callison-Burch Chris, Talbot David, Osborne Miles. “Statistical machine translation with word-and sentence-aligned parallel corpora”. Proceedings of the 42nd Annual Meeting on Association for Computational Linguistics (2004). S. 175-182.
  3. Cheragui, Mohamed Amine. “Theoretical Overview of Machine translation”. Proceedings ICWIT (2012). S. 161-163.
  4. Eder Maciej, Rybicki Jan, Kestemont Mike. “Stylometry with R: a package for computational text analysis”. R Journal 8(1) (2016). S. 107-121. Web. 15.05.2019.<https://tinyurl.com/ybjvxc7g>
  5. Goldstone Andrew, Underwood Ted. “The Quiet Transformations of Literary Studies: What Thirteen Thousand Scholars Could Tell Us”. New Literary Studies 45.3 (2014). S. 359-384.
  6. Hauer Bradley, Kondrak Grzegorz. “Decoding anagrammed texts written in an unknown language and script”. Transactions of the Association for Computational Linguistics 4 (2016). S. 75-86.
  7. Hermans, Theo. Narada języków. Red. M. Heydel, K. Szymańska. Przeł. Magda Heydel et al. Kraków: Wydawnictwo Uniwersytetu Jagiellońskiego, 2015.
  8. Heydel Magda, Rybicki Jan. “The Stylistics and Stylometry of Collabrative Translation: Woolf ’s Night and Day in Polish”. Literary and Linguistic Computing 28 (2013). S. 708-717.
  9. Jarniewicz, Jerzy. Gościnność słowa. Kraków: Wydawnictwo Znak, 2012.
  10. Jarniewicz, Jerzy. Tłumacz między innymi. Wrocław: Ossolineum 2018.
  11. Koehn, Philipp. “Europarl: A parallel corpus for statistical machine translation”. MT summit 5 (2005). S. 79-86
  12. Krüger, Ralph. From Situated Translation to CAT Tool Usability, EST Congress 2016. Translation Studies: Moving Boundaries. Web. 20.08.2019. <https://tinyurl.com/ycp3w8qm>.
  13. Mikolov Tomas, et al. “Distributed representations of words and phrases and their compositionality”. Advances in neural information processing systems (2013). S. 3111-3119.
  14. Moretti, Frank. “Patterns and Interpretation”. Pamphlet 15 (2017). Web. 20.09.2019. <https://tinyurl.com/y834za4h>
  15. Okulska, Inez. „Poetyka przekładu”. OderÜbersetzen 5 (2015). S. 152-165.
  16. Okulska, Inez. „Sieci neuronowe typu GAN i GPT-2, słowa zużyte i kreatywność, czyli literacki second-hand”. Forum Poetyki 18 (2019). Web. 12.03.2020.<https://tinyurl.com/y7y5mq3w>
  17. Pennington Jeffrey, Socher Richard, Manning Christopher D. “Glove: Global vectors for word representation”. Proceedings of the 2014 conference on empirical methods in natural language processing (EMNLP) (2014). S 1532-1543.
  18. Porter, J. D. “Popularity/Prestige”. Pamphlet 17 (2018). Web. 20.09.2019. <https://tinyurl.com/y7uvxofl>
  19. Pym, Anthony. “What technology does to translation”. Translation and Interpreting 3 (2011). S. 1-9.
  20. Rybicki, Jan. „Pierwszy rzut oka na stylometryczną mapę literatury polskiej”. Teksty Drugie 2 (2014). S. 106-128.
  21. Rybicki, Jan. „Drugi rzut oka na stylometryczną mapę literatury polskiej”. Forum Poetyki 10 (2017). Web. 15.09.2019. <https://tinyurl.com/y99rqngz>
  22. Vincent, James. “AI didn’t decode the cryptic Voynich manuscript – it just added to the mystery”. The Verge 1 Feb (2018). Web. 17.08.2019. <https://tinyurl.com/ybn24fo8>
  23. Voynich Manuscript. Opis zasobu na stronie biblioteki Beinecke Library. Web. 24.09.2019. <https://tinyurl.com/semce6e