METHODOLOGY FOR BUILDING A TEXT-STRUCTURE ORIENTED LEGAL CORPUS

Main Article Content

Cristina ONESTI

Abstract

The present study aims at showing the methodology for building a legal corpus with a special attention paid to the internal structure of legal documents and juridical texts. Built at the University of Turin, the Corpus Jus Jurium tries to cover the entire legal universe current in contemporary Italy, whose life is represented from their first conception in the parlamentary discussion, to their codification in normative rules, to their application in judgements. The Corpus Jus Jurium will be lemmatized, POS-tagged and have added a textual markup, casting some light on the still neglected textual expression of legal and juridical texts, which is decisive for every national legal system. Elaborating texts with such peculiarites implies a long amount of manual work. However, the final result can be an extremely useful resource for translators looking for idioms, collocations or terminological elements in specific parts of texts and for forensic linguists, providing them with an extensive repository of well-structured data and with fine-grained querying opportunities, whether at the morphosyntactic or lexical or textual level.

Downloads

Download data is not yet available.

Article Details

How to Cite
ONESTI, C. (2011). METHODOLOGY FOR BUILDING A TEXT-STRUCTURE ORIENTED LEGAL CORPUS. Comparative Legilinguistics, 8, 37-48. https://doi.org/10.14746/cl.2011.08.04
Section
Articles

References

  1. Barbera, Manuel, Elisa Corino, Cristina Onesti. 2007. Che cos’è un corpus? Per una definizione più rigorosa di corpus, token, markup. In Corpora e linguistica in rete, eds. Manuel Barbera, Elisa Corino and Cristina Onesti, 25-88. Perugia: Guerra Edizioni.
  2. Barbera, Manuel, Cristina Onesti. 2009. Scheda progetto di ricerca Corpus Jus Jurium. In Progetto JURA. Manuale per la formazione dei docenti e dei traduttori che operano nell’ambito del linguaggio giuridico italiano-tedesco, eds. Pierangela Diadori, 349-350. Perugia: Guerra Edizioni.
  3. Bellucci, Patrizia. 2005a. La redazione delle sentenze: una responsabilità linguistica elevata. Diritto & Formazione 5, 3: 448-66.
  4. Bellucci, Patrizia. 2005b. A onor del vero. Fondamenti di linguistica giudiziaria, Torino: UTET Libreria.
  5. Bhatia, Vijay K. 1987. Language of the Law. Language teaching: the international abstracting journal for language teachers and applied linguists 20(3): 227-34.
  6. Biagioli, Carlo, Mercatali Pietro, Sartor Giovanni, eds. 1995. Legimatica: informatica per legiferare, Napoli: Edizioni scientifiche italiane.
  7. Christ, Oliver, Bruno M. Schulze, Anja Hofmann, Esther König. 1999. The IMS Corpus Workbench: Corpus Query Processor (CQP). User’s Manual, Stuttgart: Institut für maschinelle Sprachverarbeitung (CQP V2.2). http://www.ims.unistuttgart.
  8. de/projekte/CorpusWorknbench/CQPUserManual/PDF/cqpman.pdf.
  9. Cortelazzo, Michele. 1997. Lingua e diritto in Italia: il punto di vista dei linguisti. In La lingua del diritto. Difficoltà traduttive, applicazioni didattiche, ed. Leo Schena, 35-49 (Atti del primo convegno internazionale, Università Bocconi, Milano, 5-6 ottobre 1995), Roma: CISU.
  10. Coulthard, Malcolm. 1994. On the Use of Corpora in the Analysis of Forensic Texts. Forensic Linguistics. The International Journal of Speech Language and Law I/1: 27-43.
  11. Heid, Ulrich. 2007. Il Corpus WorkBench come strumento per la linguistica dei corpora. Principi ed applicazioni. In Corpora e linguistica in rete, ed. Manuel Barbera, Elisa Corino, Cristina Onesti, 89-108. Perugia: Guerra Edizioni.
  12. Mortara Garavelli, Bice. 2001. Le parole e la giustizia. Divagazioni grammaticali e retoriche su testi giuridici italiani. Torino: Giulio Einaudi Editore.