Συζήτηση χρήστη:Lou bot/replace/μεταφράσεις/01

Από Βικιλεξικό
Πήδηση στην πλοήγηση Πήδηση στην αναζήτηση

Επιστροφή στις «μεταφράσεις»

Παρακάτω θα βρείτε ό,τι αφορά την λειτουργία του Lou bot για την πρώτη του λειτουργία (προσθήκη προτύπων στις μεταφράσεις).

Ψηφοφορία για λειτουργία του Lou bot: προσθήκη προτύπων στις μεταφράσεις που δεν τα έχουν[επεξεργασία]

Γεια σας. Μετά από μελέτη των διαφόρων αναγκών των μεταφράσεων, αρχίζουμε την ενημέρωσή τους. Πρώτα απ' όλα, θα προσθέσουμε τα πρότυπα στις μεταφράσεις που δεν έχουν ήδη (πρόκειται για παλιές μορφές του βικιλεξικού). Κατ' αυτό τον τρόπο, οι μεταφράσεις που εμφανίζουν:

δεν θα εμφανίζουν τίποτα, θα περιέχουν όμως το εξής:

<!-- * {{fr}} : {{ξεν|fr|XXX}} -->

Για περισσότερες πληροφορίες, σας προσκαλώ να διαβάσετε:

Η εντολή που θα χρησιμοποιήσω είναι η εξής:

replace_EL.py -fix:metafraseis -cat:Ελληνική γλώσσα -log:mtf

Εξηγήσεις[επεξεργασία]

  • το replace_EL.py είναι η ονομασία του αλλαγμένου (από τον Αριέλ) script replace.py,
  • το -fix:metafraseis εξηγεί στο script ότι πρέπει να διαβάσει το αρχείο fixes.py, να βρει την παράγραφο «metafraseis» και να κάνει ό,τι αυτή του λέει (να προσθέσει δηλαδή τα πρότυπα),
  • το -cat:Ελληνική γλώσσα εξηγεί ότι πρέπει να διαβάσει μόνο τις σελίδες της κατηγορίας «Ελληνική γλώσσα»
  • τέλος, το -log:mtf καταγράφει όλες τις αλλαγές στο αρχείο mtf, έτσι ώστε να ξέρουμε ακριβώς ποιες λέξεις τροποποιήθηκαν.

Παρακάτω, οργανώνω μια ψηφοφορία για να μπορέσω να τρέξω το Lou bot. - Φιλικά, Lou 13:40, 6 Οκτωβρίου 2007 (UTC)

Υπέρ[επεξεργασία]

  1. ΥΠΕΡ. Νομίζω ότι έχει συζητηθεί αρκετά. Αναρωτιέμαι αν θα έπρεπε η δοκιμή να επεκταθεί σε ένα σώμα, πχ 100 λέξεων, αν και φαντάζομαι δεν θα υπάρξει πρόβλημα --Flyax 14:50, 6 Οκτωβρίου 2007 (UTC)
    Μετά σχετική συζήτηση στο irc, αποφασίσαμε ότι θα γίνει δοκιμή στην κατηγορία των περίπου 200 «Ελληνικών αντωνυμιών», προτού μπει στην εντολή του μποτ το «Ελληνική γλώσσα». Lou 16:58, 6 Οκτωβρίου 2007 (UTC)
  2. Υπέρ, με την εντολή που αναφέρεται παραπάνω (-cat). ArielGlenn 17:41, 6 Οκτωβρίου 2007 (UTC)
  3. Υπέρ. Έκτωρ 15:26, 7 Οκτωβρίου 2007 (UTC)
  4. Υπέρ! Και καλή δουλειά!!! Μπράβο στην εξαιρετική συνεργασία-προεργασία. Ελπίζω να επιστρέψω σύντομα. λεξιCos 10:19, 8 Οκτωβρίου 2007 (UTC)

Κατά[επεξεργασία]

Άλλες γνώμες[επεξεργασία]

# -*- coding: utf-8  -*-
import codecs
import sys, re


fixes = {
    'metafraseis': {
        'regex' : True,
        'msg': {
            'el':u'Μεταφράσεις: προσθήκη προτύπων μετά τη γλώσσα',                                                                             
        },
        'replacements': [
            (u'\n\*( *)\{\{([a-z\-]+)\}\}( *):( *)\r', u'\n<!-- * {{\\2}} : {{ξεν|\\2|XXX}} -->\r'),
        ],
    },
}

Απρόοπτα[επεξεργασία]

Μετά την πρώτη κίνηση του μποτ, είδαμε ότι υπήρχε ένα απρόσμενο γεγονός: οι λέξεις με *Φιλανδικά: εμφανίζονταν μόνες τους. Ο Χρήστης:ArielGlenn μέτρησε τις λέξεις και βρήκε ότι υπήρχαν 223. Γι' αυτό το λόγο, πρόσθεσα στο fixes.py τη γραμμή:

(u'\n\*Φιλανδικά:( *)\r', u'\n<!-- * {{fi}} : {{ξεν|fi|XXX}} -->\r'),

Μετά τη δεύτερη κίνηση, είδαμε ότι εμφανιζόταν η κατηγορία *Κρι:. Ο Χρήστης:ArielGlenn τις μέτρησε κι αυτές και βρήκε ότι υπήρχαν 60. Πρόσθεσα λοιπόν τη γραμμή:

(u'\n\*Κρι:( *)\r', u'\n<!-- * {{cr}} : {{ξεν|cr|XXX}} -->\r'),

για να τις κρύψω κι αυτές.

Τότε όμως είδαμε ότι υπήρχε κι άλλο απρόσμενο: μερικές φορές εμφανιζόντουσαν «βελάκια». Αυτό γινόταν επειδή, άλλοτε, στις πολύ παλιές λέξεις του ΒΛ, χρησιμοποιούσαν πότε πότε, για να κρύβουν τις κενές μεταφράσεις, τη μέθοδο με τα βελάκια στην αρχή και στο τέλος ενός πακέτου γραμμών (κι όχι σε κάθε γραμμή, όπως σήμερα). Επειδή οι επιμέρους καταστάσεις φαίνεται ότι πολλαπλασιάζονται, προτίμησα σε πρώτη φάση να βάλω το μποτ μπρος βάσει του αρχείου των 223 λέξεων αλλά με τις τρεις γραμμές, ως ακολουθεί.

# -*- coding: utf-8  -*-
help = """
  * HTML  - Convert HTML tags to wiki syntax, and fix XHTML.
"""  
import codecs
import sys, re


fixes = {
    'metafraseis': {
        'regex' : True,
        'msg': {
            'el':u'Μεταφράσεις: προσθήκη προτύπων μετά τη γλώσσα',                                                                             
        },
        'replacements': [
            (u'\n\*( *)\{\{([a-z\-]+)\}\}( *):( *)\r', u'\n<!-- * {{\\2}} : {{ξεν|\\2|XXX}} -->\r'),
            (u'\n\*Φιλανδικά:( *)\r', u'\n<!-- * {{fi}} : {{ξεν|fi|XXX}} -->\r'),
            (u'\n\*Κρι:( *)\r', u'\n<!-- * {{cr}} : {{ξεν|cr|XXX}} -->\r'),
        ],
    },
}

Όταν τελειώσουν αυτές οι αλλαγές (εκτός νέου απροόπτου), θα συνεχίσω με τις μεγάλες κατηγορίες (επιρρήματα, επίθετα, ουσιαστικά, κλπ.)

«Κρι» χωρίς «Φιλανδικά»[επεξεργασία]

Τελικά, ο Χρήστης:ArielGlenn μας μέτρησε τα άρθρα που είχαν «Κρι» χωρίς «Φιλανδικά»: ήταν μόνο 6!! (και τα αλλάξαμε «με το χέρι»!).

Νέα από... το μέτωπο![επεξεργασία]

Τέρμα τα κρι και τα φινλανδικά. Προχωράμε με το πρώτο fixes.py, ανά κατηγορία.

# -*- coding: utf-8  -*-
import codecs
import sys, re


fixes = {
    'metafraseis': {
        'regex' : True,
        'msg': {
            'el':u'Μεταφράσεις: προσθήκη προτύπων μετά τη γλώσσα',                                                                             
        },
        'replacements': [
            (u'\n\*( *)\{\{([a-z\-]+)\}\}( *):( *)\r', u'\n<!-- * {{\\2}} : {{ξεν|\\2|XXX}} -->\r'),
        ],
    },
}

Η τελευταία «έκδοση» της εντολής που δίνω είναι η εξής:

replace.py -fix:metafraseis -log:otinanai -namespace:0 -start:leksi
  • το -log είναι ένα οποιοδήποτε όνομα
  • το -start λέει στο ρομπότ από ποια λέξη να αρχίσει
  • το -namespace:0 του λέει να μην ασχοληθεί ούτε με τις συζητήσεις, ούτε με τις σελίδες βοήθειας, ή άλλου είδους - και να ασχοληθεί αποκλειστικά με τα «γλωσσολογικά» άρθρα του βικιλεξικού.

Ταυτόχρονα, για λόγους ταχύτητας, υπάρχουν διάφορα ρομπότ που αρχίζουν το καθένα από ξεχωριστό γράμμα. Lou 22:25, 9 Οκτωβρίου 2007 (UTC)