Ο νόμος του Zipf - Point of view

Εν τάχει

Ο νόμος του Zipf




Ο νόμος του Zipf πήρε το όνομά του από τον εξαιρετικά εκκεντρικό Αμερικανό γλωσσολόγο George Kingsley Zipf (1902-1950) και είναι ένας εμπειρικός νόμος που αναφέρεται στο γεγονός ότι πολλοί τύποι των δεδομένων που μελετήθηκαν και στις φυσικές και στις κοινωνικές επιστήμες, ακολουθούν μια κατανομή γνωστή ως νόμος των δυνάμεων (power law).

Ο νόμος αναδύεται σε φαινόμενα όπου έχουμε πολλά και μικρά γεγονότα και λίγα αλλά μεγάλα γεγονότα, πχ. έχουμε πολύ λίγους και μεγάλους σεισμούς και πολλούς μικρούς σεισμούς, έχουμε λίγους και πλούσιους και πολλούς αλλά φτωχούς, έχουμε λίγες αλλά μεγάλες πόλεις και πολλές αλλά μικρές, έχουμε λίγους αλλά πολύ δημοφιλείς ιστότοπους αλλά πολλούς που δεν τους έχει επισκεφτεί κανείς κλπ.

Ο ίδιος ο Zipf ασχολήθηκε με το να προβλέψει τη συχνότητα της εμφάνισης των λέξεων μέσα σε ένα κείμενο. Δηλώνει δε ότι «αν οι λέξεις ταξινομηθούν κατά φθίνουσα σειρά του αριθμού εμφάνισής τους σε ένα σχετικά μεγάλο κείμενο, τότε η θέση/σειρά μιας λέξης σε αυτόν τον κατάλογο όταν πολλαπλασιάζεται με τη συχνότητα εμφάνισής της είναι ίση με μια σταθερά».

Η εξίσωση για αυτή τη σχέση είναι: 

r x f = k

όπου r είναι η θέση/σειρά της λέξης, f είναι η συχνότητα και k είναι η σταθερά.

Για παράδειγμα αν μέσα σε ένα αρκετά μεγάλο κείμενο μια λέξη που βρίσκεται στην θέση 1 (π.χ. η λέξη the) εμφανίζεται 1000 φορές, τότε η λέξη της θέσης 2 (π.χ. η λέξη of) θα εμφανίζεται περίπου 500 φορές, η λέξη της θέσης 3 (π.χ. η λέξη and) θα εμφανίζεται περίπου 300 φορές, κτλ.


Η ίδια σχέση εμφανίζεται και σε πολλές άλλες ταξινομήσεις που δεν σχετίζονται με τη γλώσσα, όπως στην πληθυσμιακή κατάταξη των πόλεων σε διάφορες χώρες, τα μεγέθη των εταιριών, τα εισοδήματα των φυσικών προσώπων και ούτω καθεξής. Η εμφάνιση της κατανομής στην κατάταξη των πόλεων βάση πληθυσμού παρατηρήθηκε για πρώτη φορά από τον Felix Auerbach το 1913.

Αν και δεν είναι γνωστό γιατί ο νόμος του Zipf ισχύει (όπως συμβαίνει πχ. για τις περισσότερες γλώσσες), ο ίδιος ο Zipf πρότεινε την αρχή της ελάχιστης προσπάθειας ως μια πιθανή εξήγηση.

Σύμφωνα με τον ίδιο ούτε οι ομιλητές ούτε οι ακροατές, χρησιμοποιώντας μια συγκεκριμένη γλώσσα, θέλουν να καταβάλουν μεγαλύτερη προσπάθεια από αυτήν που είναι αναγκαία για την επίτευξη της κατανόησης και η διαδικασία αυτή οδηγεί στην χρήση λέξεων που εμφανίζουν την παρατηρούμενη κατανομή Zipf.

Αρχή της ελάχιστης προσπάθειας

Η αρχή της ελάχιστης προσπάθειας είναι μια διαδεδομένη θεωρία που καλύπτει διάφορους τομείς από την εξελικτική βιολογία έως την σχεδίαση ιστοσελίδων. Προϋποθέτει ότι τα ζώα, οι άνθρωποι, ακόμη και οι καλά σχεδιασμένες μηχανές θα επιλέξουν τον δρόμο της μικρότερης αντίστασης ή «προσπάθειας» προκειμένου να πετύχουν κάποιον στόχο τους.

Η αρχή ανακαλύφθηκε από τον Γάλλο φιλόσοφο Guillaume Ferrero (Revue Philosophique de la France et de l'Etranger, 1894) και είναι γνωστή ως «ντετερμινιστική περιγραφή της ανθρώπινης συμπεριφοράς».

Η αρχή της ελάχιστης προσπάθειας είναι στενά συνδεδεμένη με άλλες παρόμοιες αρχές, όπως αυτές της ελάχιστης δράσης και της μέγιστης εντροπίας.

Πηγές
Eisatopon
Wikipedia
via

Pages