2001 - "οικΟΝΟΜΙΑ": ένα σώμα σχολιασμένων οικονομικών κειμένων

"οικΟΝΟΜΙΑ": ένα σώμα σχολιασμένων οικονομικών κειμένων"
Π. Αρβανίτης - κ.ά. (Ομαδική εισήγηση).
Πρακτικά της 22ης Ετήσιας Συνάντησης Εργασίας του Τομέα Γλωσσολογίας του Τμήματος Φιλολογίας του Α.Π.Θ., σελ. 20-31, Θεσσαλονίκη 2001.

Αντικείμενο της παρούσας εργασίας είναι η παρουσίαση του σώματος οικονομικών κειμένων το οποίο συλλέχθηκε, χαρακτηρίστηκε και σχολιάστηκε σε διάφορα επίπεδα γλωσσικής ανάλυσης στο πλαίσιο του προγράμματος ΕΠΕΤ "οικΟΝΟΜίΑ" για την ανάπτυξη και τον έλεγχο συστήματος εξαγωγής πληροφορίας. Το υπό ανάπτυξη Σύστημα Αναγνώρισης ασχολείται με την αναγνώριση ονοματικών οντοτήτων (πρόσωπα, οργανισμοί, τοπωνύμια, χρονικές εκφράσεις, αριθμητικές εκφράσεις) από Η/Υ, σε ελεύθερο κείμενο, σύμφωνα με τις προδιαγραφές των Διεθνών συνεδρίων αξιολόγησης των Συστημάτων Εξαγωγής Πληροφοριών (Message Understanding Conferences – MUC), προσαρμοσμένων όμως στα ελληνικά δεδομένα.

Στη παρούσα εργασία περιγράφεται η διαδικασία συλλογής των κειμένων (κείμενα έντυπου ή απομαγνητοφωνημένα κείμενα ηλεκτρονικού τύπου), η μεθοδολογία που ακολουθήθηκε, οι προδιαγραφές που τέθηκαν κατά το γλωσσολογικό σχολιασμό ανά επίπεδο, καθώς επίσης και τα υπολογιστικά εργαλεία που χρησιμοποιήθηκαν για την επεξεργασία των κειμένων. Για την εργασία, απαιτήθηκε ο σχεδιασμός και η υλοποίηση μιας πρωτότυπης Βάσης Δεδομένων για την συγκέντρωση και καταγραφή του σώματος κειμένων (σώμα 120.000 περίπου λέξεων) που ανέλαβε ο γράφων.


--------------------
"οικΟΝΟΜΙΑ": A project for annotated economic corpora" (in collaboration).
In Proceedings of 22th Symposium on Applied Linguistics organised by the Department Of Philology and Linguistics, Aristotle University of Thessaloniki, pp. 20-31, Thessaloniki 2001.

020Get the full paper here - Aristotle University of Thessaloniki-Digital repository

© 2019 Παναγιώτης Αρβανίτης - Panagiotis Arvanitis

Search