Συζήτηση χρήστη:Lou bot/tranInter2/getall.pl

Από Βικιλεξικό
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

<<<

Η λίστα γλωσσών είναι της 28/11/2007.

Εντολή[επεξεργασία]

Πηγαίνουμε στον κατάλογο όπου βρίσκεται το "getall.pl" και το τρέχουμε με την εντολή:

perl getall.pl

Script[επεξεργασία]

#!/usr/bin/perl

# Encoding : UTF8
# Is used with RAW XML !!!
# 

my ($sec,$min,$hour,$mday,$mon,$year,$wday,$yday,$isdst) = localtime(time);
$year += 1900 ;
$mon += 1 ;

@ttlang = ( "fr", "en", "vi", "tr", "el", "ru", "io", "zh", "pl", "it", "fi", "de", "sv", "pt", "ku", "hu", "id", "te", "ko", "es", "nl", "bg", "ja", "vo", "gl", "sr", "et", "fa", "is", "lt", "ro", "af", "ar", "scn", "sl", "hy", "ta", "zh-min-nan", "la", "no", "he", "br", "ur", "da", "ca", "tlh", "sq", "fy", "cs", "hr", "uk", "ast", "sw", "simple", "ang", "kk", "hi", "st", "sk", "co", "nds", "kl", "csb", "ml", "li", "ky", "sd", "az", "oc", "th", "ti", "tt", "gu", "eo", "mk", "ia", "ug", "tl", "ts", "rw", "qu", "ga", "cy", "bs", "mr", "fo", "ms", "ie", "chr", "an", "yi", "am", "su", "kn", "nah", "gd", "be", "pa", "wo", "zu", "lv", "km", "nn", "ps", "mi", "so", "dv", "bn", "mn", "ha", "tg", "ka", "mg", "na", "gv", "sa", "tpi", "ay", "ss", "ne", "jbo", "uz", "tn", "as", "eu", "gn", "mt", "pi", "lb", "ks", "tk", "sg", "fj", "jv", "sh", "mo", "xh", "ik", "als", "kw", "ln", "sm", "si", "za", "mh", "ba", "or", "sn", "ak", "iu", "bh", "lo", "roa-rup", "bm", "bi", "to", "aa", "av", "rn", "yo", "dz", "tw", "om", "cr", "ab", "my", "wa", "sc", "ch", "bo", "rm", "tokipona" ) ;

$today = "$year-$mon-$mday" ;

open( RESFILE,">$today.txt");

foreach ( @ttlang ) {
  $lang_cur = $_ ;
  $url1 = "http://download.wikimedia.org/" ;
  $url2 = "wiktionary/latest/" ;
  $url3 = "wiktionary-latest-all-titles-in-ns0" ;
  `wget $url1$lang_cur$url2$lang_cur$url3.gz` ;
  `gunzip $lang_cur$url3.gz`;
  open( XMLFILE, "< $lang_cur$url3" ) ;

  $line = <XMLFILE> ; # we don't take the first line into account
  while ( $line = <XMLFILE> ) {
    $line =~ s/_/ /g;
    print RESFILE "$lang_cur:$line" ;
  }
#  `rm $lang_cur$url3.gz` ;
  `rm $lang_cur$url3` ;
}