Συζήτηση βικιλεξικού:Αριθμός λημμάτων ανά γλώσσα

Από Βικιλεξικό
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Τρόπος υπολογισμού[επεξεργασία]

Πολύ απλά, ο ένας από τους δύο τρόπους βγάζει λανθασμένα αποτελέσματα. Ας μετρήσουμε μόνοι μας μια κατηγορία: Η αγγλική γλώσσα έχει 36 σελίδες, η πρώτη με 199 λήμματα, οι επόμενες με 200 και η τελευταία με 176. Δηλαδή 7175. Άλλο: Κλιτές μορφές ουσιαστικών (γαλλικά): Είναι λίγα και μετριούνται με το χέρι και βγαίνουν 44, όχι 43. Δεν ξέρω τι συμβαίνει με το editcount και τα βγάζει λάθος. Μπορεί να φταίει η cache, να μην ενημερώνεται δηλαδή αμέσως, ή να υπάρχει κάποιο σφάλμα στον προγραμματισμό. --Flyax 08:43, 2 Φεβρουαρίου 2009 (UTC)[απάντηση]

Σύγκριση των αποτελεσμάτων που δίνει το ΒΛ με αυτά του category count[επεξεργασία]

Δοκίμασα με τη γερμανική γλώσσα.

Η «Κατηγορία:Γερμανική γλώσσα» σε μια δεδομένη στιγμή έδινε 1897 λέξεις. Από αυτές, δύο ήταν κλιτές μορφές.

Την ίδια στιγμή, το category count (http://tools.wikimedia.de/~erwin85/categorycount.php) έδινε, ανάλογα με τις οδηγίες που του δίναμε:

  1. namespace articles, χωρίς subcategories : 1664
  2. namespace articles, με subcategories : 1664
  3. namespace all, χωρίς subcategories : 1668
  4. namespace all, με subcategories : 1694

Το 1 και το 2 είναι ολόιδια, κάτι που μου φαίνεται λογικό (δεν υπάρχουν υποκατηγορίες μέσα στα άρθρα).

Ανάμεσα στο 3 και τα 1-2, υπάρχει διαφορά 4, κάτι που μου φαίνεται εξίσου λογικό (εκείνη τη στιγμή υπήρχαν 4 υποκατηγορίες).

Ανάμεσα όμως στο 3 και το 4, υπάρχει διαφορά 26, κάτι που δεν καταλαβαίνω.

Έψαξα όλες τις υποκατηγορίες που μπορούσα να βρω. Αυτές ήταν οι εξής:

[+] Γραμματικές κατηγορίες (γερμανικά) (13)
[+] Ουσιαστικά (γερμανικά) (1)
[+] Κλιτές μορφές ουσιαστικών (γερμανικά) (0)
[+] Σύνδεσμοι (γερμανικά) (0)
[+] Ρήματα (γερμανικά) (2)
[+] Κλιτές μορφές ρημάτων (γερμανικά) (0)
[+] Ανώμαλα ρήματα (γερμανικά) (0)
[+] Αντωνυμίες (γερμανικά) (0)
[+] Αριθμητικά (γερμανικά) (0)
[+] Εκφράσεις (γερμανικά) (0)
[+] Επίθετα (γερμανικά) (1)
[+] Κλιτές μορφές επιθέτων (γερμανικά) (0)
[+] Επιρρήματα (γερμανικά) (0)
[+] Επιφωνήματα (γερμανικά) (0)
[+] Επιθήματα (γερμανικά) (0)
[+] Κύρια ονόματα (γερμανικά) (0)
[+] Προθέσεις (γερμανικά) (0)
[+] Συντομομορφές (γερμανικά) (1)
[+] Αρκτικόλεξα (γερμανικά) (0)
[+] Γερμανικές λέξεις ξένης προέλευσης (1)
[+] Γερμανικές λέξεις λατινικής προέλευσης (0)
[+] Θεματικές κατηγορίες (γερμανικά) (8)
[+] Αστερισμοί στα γερμανικά (0)
[+] Ζώα στα γερμανικά (0)
[+] Λαχανικά στα γερμανικά (0)
[+] Χώρες και ήπειροι στα γερμανικά (0)
[+] Αστρονομία (γερμανικά) (0)
[+] Γεωγραφία (γερμανικά) (0)
[+] Γραμματική (γερμανικά) (0)
[+] Χημεία (γερμανικά) (0)
[+] Θεματικές κατηγορίες στα γερμανικά (1)
[+] Τεχνολογία (γερμανικά) (0)

Εάν αποκλείσουμε την πιθανότητα bug του προγράμματος, κάτι που διαφεύγει. Όμως, και να υπήρχαν υποκατηγορίες, αυτές θα έπρεπε να προστεθούν στον συνολικό αριθμό, όχι να αφαιρεθούν! Εάν δεν βρούμε τι δεν πάει καλά, ή εάν δεν αλλάξει το category count, αυτό σημαίνει πως δεν μπορούμε να το εμπιστευτούμε.

Ερχόμαστε τώρα σε κάτι άλλο. Την πελώρια διαφορά που υπάρχει ανάμεσα στους λογαριασμούς του category count και τον υπολογισμό του ΒΛ.

1897 - 1664 = 233
1897 - 1668 = 229
1897 - 1694 = 203

Αυτήν τη διαφορά, δεν κατάφερα να την ξεδιαλύνω...

Υπάρχει και ένα... μικρούτσικο προβληματάκι με τον υπολογισμό του ΒΛ... Προσθέτοντας (λίγο αργότερα) τους αριθμούς που δίνει σε κάθε σελίδα, έβρισκα το εξής:

196 + 8x200 + 106 = 1902

Όμως, αυτό (το ΒΛ) έλεγε «από 1.901 συνολικά» ! Αυτό συνεχίστηκε προσθέτοντας 5 λέξεις. Γιατί λείπει συστηματικά 1 ; Περίεργο, πολύ περίεργο...

Αυτά τα ολίγα. Για τους παραπάνω λόγους, σταματώ να χρησιμοποιώ το category count και περνώ πλέον μόνο στους υπολογισμούς του ΒΛ, άσχετα αν χρειάζεται να αφαιρώ «με το χέρι» όλες τις υποκατηγορίες κλιτών μορφών. Εάν κάποιος μπορέσει να μου πει τι δεν κάνω καλά με το category count, μπορεί να ξαναγυρίσω σ' αυτό, λόγω της ευκολίας χρήσης του.

Ευχαριστώ για την υπομονή σας και για τις ενδεχόμενες παρατηρήσεις σας! - Βικιφιλικά, Lou 18:27, 2 Φεβρουαρίου 2009 (UTC)[απάντηση]

Νέος τίτλος[επεξεργασία]

Κάποιες από τις Ιταλικές γλώσσες 'έχουν περάσει απο καιρό τα 50 άρθρα και πρέπει να προστεθούν στη λίστα --tony esopiλέγε 21:10, 22 Οκτωβρίου 2011 (UTC)[απάντηση]

Άλλαξα τον τίτλο της τελευταίας κατηγορίας για να λαμβάνονται υπόψη και μερικές ακόμη « ιταλικές » γλώσσες... κάνω ματάκι --Lou (συζήτηση) 12:18, 12 Ιουνίου 2013 (UTC)[απάντηση]

Αλλαγή μορφής[επεξεργασία]

Γίνεται να αλλάξει η μορφή της σελίδας και να γίνει σαν ένα πινακάκι με κατάταξη βασιζόμενη στα λήμματα; ICarlytranslator (συζήτηση) 09:33, 12 Ιουνίου 2013 (UTC)[απάντηση]

Ίσως να γίνεται και αυτόματα... Αλλά μή μου πάρεις αυτή τη «μικρή» χαρούλα που έχω, να ενημερώνω πού και πού, με το χέρι, αυτόν τον πίνακα!... χαμογελάω --Lou (συζήτηση) 12:22, 12 Ιουνίου 2013 (UTC)[απάντηση]

Εννοούσα κάτι σαν αυτό:

Θέση Γλώσσα Λήμματα
1 Ελληνικά 98.859
2 Γαλλικά 32.674
... ... ...

ICarlytranslator (συζήτηση) 07:14, 13 Ιουνίου 2013 (UTC)[απάντηση]

Η αρχική ιδέα - που εξηγεί τη μορφή που έχει σήμερα - ήταν ότι σπρώχνει κατά κάποιον τρόπο τους χρήστες να βάζουν λέξεις στη γλώσσα που τους ενδιαφέρει (αν και αυτή αλλάζει πότε πότε), έτσι ώστε αυτή να ανεβαίνει από κατηγορία σε κατηγορία... κάνω ματάκι Ένας πίνακας είναι κάπως απρόσωπος... Άλλωστε, αξίζει τόσο πολύ αυτή η αλλαγή; Αν βέβαια θεωρείς ότι αξίζει, άλλαξέ το. --Lou (συζήτηση) 17:14, 13 Ιουνίου 2013 (UTC)[απάντηση]

"Λιγότερα από 50 λήμματα"[επεξεργασία]

Νομίζω ότι χρειάζεται και αυτό για να ξέρουμε πόσα λήμματα υπάρχουν σε άλλες γλώσσες στο ελληνικό ΒΛ. Επίσης, έτσι θα δείχνει και πιο ολοκληρωμένο. ICarlytranslator (συζήτηση) 06:59, 13 Ιουνίου 2013 (UTC)[απάντηση]

Άλλη μορφή[επεξεργασία]

Και κάτι τέτοιο δεν θα ήταν καλό;--sVlioras (συζήτηση) 11:16, 15 Ιουνίου 2013 (UTC)[απάντηση]

Γλώσσα Λήμματα
νέα ελληνικά 98.859
γαλλικά 32.674
αγγλικά 25.928
εσπεράντο 11.044
ιταλικά 4.606
αρχαία ελληνικά 12.463
γερμανικά 6.841
πολωνικά 3.995
φινλανδικά 2.275
ισπανικά 2.344
ρουμανικά 2.398
Στις τελευταίες ολιγομελείς κατηγορίες γίνεται «χαμός». Με κάθε σελίδα που προστίθεται αλλά ζει η κατάταξη και είναι πρακτικά αδύνατον να είναι η σελίδα συνεχώς ενημερωμένη, καθώς δεν αρκεί να μετακινήσεις προς τα πάνω μια γλώσσα, αλλά πρέπει να αλλάξεις και τον α/α σε όλες τις γλώσσες από κάτω της. Η αυθόρμητη σκέψη μου είναι να τις σβήσω όλες και να ησυχάσουμε, αλλά μην ανησυχείτε, δεν το κάνω. :P --Flyax (συζήτηση) 06:27, 10 Οκτωβρίου 2013 (UTC)[απάντηση]

Οι υποκατηγορίες στις κατηγορίες είναι άρθρα;[επεξεργασία]

Έχω παρατηρήσει πως σε κάθε κατηγορία μετράνε και οι υποκατηγορίες ως άρθρα. Πειράζει; --Εγώ (μίλα μου) 08:46, 17 Ιουλίου 2013 (UTC)[απάντηση]

Αλλαγή στο κείμενο πριν τον πίνακα[επεξεργασία]

Σημείωσα ότι :

Οι αριθμοί που βλέπετε στον πίνακα αφορούν μόνο τα κύρια λήμματα και όχι τους κλιτικούς τύπους οι οποίοι δεν προσμετρώνται στα σύνολα του πίνακα. - Numbers include main lemmata. They do not include clitic forms which are not counted in this table.

Η αιτιολογία είναι η εξής:

Αν δει κανείς το πρώτο νούμερο, εκεί γράφει τώρα: «Το ελληνικό Βικιλεξικό έχει 702.991 λήμματα για παραπάνω από 250 γλώσσες!»

Αν όμως προσθέσει κανείς τα λήμματα που αναφέρονται στον πίνακα βγάζει 361.028. Τα υπόλοιπα είναι κλιτικοί τύποι. --FocalPoint (συζήτηση) 08:58, 1 Ιανουαρίου 2020 (UTC)[απάντηση]

☏ FocalPoint εγώ έβλεπε 164.000 και νόμιζα ότι ήταν όλα. SOrry, αργώ λίγο. Entωμεταξύ, δείτε Πρότυπο:sarritest sarri.greek (συζήτηση) 09:03, 1 Ιανουαρίου 2020 (UTC)[απάντηση]


sarri.greek υποτίθεται ότι τα νέα ελληνικά έχουν τώρα 164.689 λήμματα. Ορθό μεν, εξαρτάται όμως τι υπολογίζει κανείς ως λήμματα. Οι κλιτικοί τύποι δεν υπολογίζονται. Για παράδειγμα, η Κατηγορία:Κλιτές μορφές επιθέτων (νέα ελληνικά) περιέχει ήδη 116.854 λήμματα, τα οποία δεν προσμετρώνται. --FocalPoint (συζήτηση) 09:05, 1 Ιανουαρίου 2020 (UTC)[απάντηση]

Τα ελληνικά (αρχαία και νέα) που είναι στην Κατηγορία:Αντίστροφο λεξικό (ελληνικά), είναι 511.986 συνολικά . --FocalPoint (συζήτηση) 09:10, 1 Ιανουαρίου 2020 (UTC)[απάντηση]