Συζήτηση χρήστη:Lou bot/tranInter2/getall.pl
Μετάβαση στην πλοήγηση
Πήδηση στην αναζήτηση
Η λίστα γλωσσών είναι της 28/11/2007.
Εντολή
[επεξεργασία]Πηγαίνουμε στον κατάλογο όπου βρίσκεται το "getall.pl" και το τρέχουμε με την εντολή:
perl getall.pl
Script
[επεξεργασία]#!/usr/bin/perl # Encoding : UTF8 # Is used with RAW XML !!! # my ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(time); $year += 1900 ; $mon += 1 ; @ttlang = ( "fr", "en", "vi", "tr", "el", "ru", "io", "zh", "pl", "it", "fi", "de", "sv", "pt", "ku", "hu", "id", "te", "ko", "es", "nl", "bg", "ja", "vo", "gl", "sr", "et", "fa", "is", "lt", "ro", "af", "ar", "scn", "sl", "hy", "ta", "zh-min-nan", "la", "no", "he", "br", "ur", "da", "ca", "tlh", "sq", "fy", "cs", "hr", "uk", "ast", "sw", "simple", "ang", "kk", "hi", "st", "sk", "co", "nds", "kl", "csb", "ml", "li", "ky", "sd", "az", "oc", "th", "ti", "tt", "gu", "eo", "mk", "ia", "ug", "tl", "ts", "rw", "qu", "ga", "cy", "bs", "mr", "fo", "ms", "ie", "chr", "an", "yi", "am", "su", "kn", "nah", "gd", "be", "pa", "wo", "zu", "lv", "km", "nn", "ps", "mi", "so", "dv", "bn", "mn", "ha", "tg", "ka", "mg", "na", "gv", "sa", "tpi", "ay", "ss", "ne", "jbo", "uz", "tn", "as", "eu", "gn", "mt", "pi", "lb", "ks", "tk", "sg", "fj", "jv", "sh", "mo", "xh", "ik", "als", "kw", "ln", "sm", "si", "za", "mh", "ba", "or", "sn", "ak", "iu", "bh", "lo", "roa-rup", "bm", "bi", "to", "aa", "av", "rn", "yo", "dz", "tw", "om", "cr", "ab", "my", "wa", "sc", "ch", "bo", "rm", "tokipona" ) ; $today = "$year-$mon-$mday" ; open( RESFILE,">$today.txt"); foreach ( @ttlang ) { $lang_cur = $_ ; $url1 = "http://download.wikimedia.org/" ; $url2 = "wiktionary/latest/" ; $url3 = "wiktionary-latest-all-titles-in-ns0" ; `wget $url1$lang_cur$url2$lang_cur$url3.gz` ; `gunzip $lang_cur$url3.gz`; open( XMLFILE, "< $lang_cur$url3" ) ; $line = <XMLFILE> ; # we don't take the first line into account while ( $line = <XMLFILE> ) { $line =~ s/_/ /g; print RESFILE "$lang_cur:$line" ; } # `rm $lang_cur$url3.gz` ; `rm $lang_cur$url3` ; }