Μια χρήση του AntConc στην ελληνική βιβλιογραφία συναντάμε στο βιβλίο "Ο προφορικός λόγος στα Ελληνικά" του Διονύση Γούτσου. Το βιβλίο βρίσκεται αναρτημένο δωρεάν στην τοποθεσία Google Books. To βιβλίο μελετάει τις χρήσεις λέξεων κι εκφράσεων στον προφορικό λόγο σε σχέση με το γραπτό κείμενο. Το λογισμικό χρησιμοποιήθηκε σε αρκετά σημεία της μεθοδολογίας της έρευνας, όπως μπορούμε να δούμε με αναζήτηση στο εσωτερικό του. Ακολουθεί ένα απόσπασμα :
"Η ανάλυση βασίστηκε σε αυθεντικά δεδομένα αυθόρμητης καθημερινής συνομιλίας μεταξύ φυσικών ομιλητών. Επιλέχθηκαν από το ΣΕΚ 73 απομαγνητοφωνημένα αρχεία, το μέγεθος των οποίων ξεπερνά τις 250.000 λέξεις. Η επεξεργασία τους πραγματοποιήθηκε μέσω του λογισμικού Antconc (Anthony 2011) το οποίο παρέχει τη δυνατότητα αυτόματης εξαγωγής λεξικών συμπλεγμάτων (βλ. ενότητα 3) εμφανίζοντας παράλληλα στατιστικές μετρήσεις.
Σε πρώτο στάδιο αναζητήθηκε η εμφάνιση του δεν ως μεμονωμένης λέξης. Λόγω της μεγάλης συχνότητας εμφάνισης των τύπων κρίθηκε σκόπιμο να ταξινομηθούν τα δεδομένα σε ομοιογενείς ομάδες με κριτήριο κατηγοριοποίησης τις επαναλαμβανόμενες συνεμφανίσεις του αρνητικού μορίου με άλλα λεξικά στοιχεία σε ένα περιορισμένο κειμενικό περιβάλλον 2 έως 7 λέξεων. Από το πλήθος των εξαγομένων απομονώθηκαν και εξετάστηκαν οι 20 πρώτες εμφανίσεις ως ελάχιστες ενότητες γλωσσικής έκφρασης.
Η ανάλυση των δεδομένων κινήθηκε σε δύο άξονες: ο πρώτος αφορά την παρουσία του δεν περιοριστικά, δηλαδή εντός των επαναλαμβανόμενων λεξικών συνδυασμών, και ο δεύτερος την εμφάνιση συμπλεγμάτων που το περιέχουν στην ευρύτερη προτασιακή δομή. Σε αυτή τη σταδιακή διαδικασία η προσέγγισή μας έχει χαρακτήρα στατιστικό, περιγραφικό και ερμηνευτικό. Η παρατήρηση της γλωσσικής προτίμησης στις αποφατικές εκφορές των ομιλητών θα προσανατολιστεί στις λεξιλογικές και συντακτικές επιλογές του, καθώς και στις επικοινωνιακές του λειτουργίες."
Σε πρώτο στάδιο αναζητήθηκε η εμφάνιση του δεν ως μεμονωμένης λέξης. Λόγω της μεγάλης συχνότητας εμφάνισης των τύπων κρίθηκε σκόπιμο να ταξινομηθούν τα δεδομένα σε ομοιογενείς ομάδες με κριτήριο κατηγοριοποίησης τις επαναλαμβανόμενες συνεμφανίσεις του αρνητικού μορίου με άλλα λεξικά στοιχεία σε ένα περιορισμένο κειμενικό περιβάλλον 2 έως 7 λέξεων. Από το πλήθος των εξαγομένων απομονώθηκαν και εξετάστηκαν οι 20 πρώτες εμφανίσεις ως ελάχιστες ενότητες γλωσσικής έκφρασης.
Η ανάλυση των δεδομένων κινήθηκε σε δύο άξονες: ο πρώτος αφορά την παρουσία του δεν περιοριστικά, δηλαδή εντός των επαναλαμβανόμενων λεξικών συνδυασμών, και ο δεύτερος την εμφάνιση συμπλεγμάτων που το περιέχουν στην ευρύτερη προτασιακή δομή. Σε αυτή τη σταδιακή διαδικασία η προσέγγισή μας έχει χαρακτήρα στατιστικό, περιγραφικό και ερμηνευτικό. Η παρατήρηση της γλωσσικής προτίμησης στις αποφατικές εκφορές των ομιλητών θα προσανατολιστεί στις λεξιλογικές και συντακτικές επιλογές του, καθώς και στις επικοινωνιακές του λειτουργίες."
No comments:
Post a Comment