Συζήτηση χρήστη:Flubot/Κλείδα ταξινόμησης

Από Βικιλεξικό
Μετάβαση στην πλοήγηση Πήδηση στην αναζήτηση

Θα μπορούσαν τα μέρη του λόγου να μπουν χωριστά σε ένα αρχειάκι, (μάλιστα και σαν array το οποίο να γίνεται join με το "|" σαν ενδιάμεσο για να είναι πιο εύκολη η αναγνώριση και προσθαφαίρεση των τμημάτων) και να μη χρειάζεται να γίνεται αλλαγή σε κάθε script. Π.χ.

#!/usr/bin/python
# -*- coding: utf-8 -*-
# filename fixesstrings.py
from array import array

def spaces_tag():
	return re.compile('([ \*\.,\'\-\(\)]*)')

def apost_tag():
	return re.compile(u'\’')

def meros_olo():
	meros=[] #δημιουργία array
	meros.append(u'άρθρο')
	meros.append(u'ουσιαστικό')
	meros.append(u'συντομομορφή')
	meros.append(u'κύριο όνομα')
	meros.append(u'πολυλεκτικός όρος')
	meros.append(u'επίθετο')
	meros.append(u'επιθετική έκφραση')
	meros.append(u'προθετική έκφραση')
	meros.append(u'αντωνυμία')
	meros.append(u'μετοχή')
	meros.append(u'ρήμα')
	meros.append(u'ρηματική έκφραση')
	meros.append(u'έκφραση')
	meros.append(u'επίρρημα')
	meros.append(u'επιρρηματική έκφραση')
	meros.append(u'πρόθεση')
	meros.append(u'σύνδεσμος')
	meros.append(u'επιφώνημα')
	meros.append(u'αριθμητικό')
	meros.append(u'μόριο')
	meros.append(u'πρόθημα')
	meros.append(u'επίθημα')
	meros.append(u'έκφραση')
	meros.append(u'ρίζα')
	meros.append(u'μορφή ουσιαστικού')
	meros.append(u'μορφή επιθέτου')
	meros.append(u'μορφή μετοχής')
	meros.append(u'μορφή αντωνυμίας')
	meros.append(u'μορφή ρήματος')
	meros.append(u'μορφή κυρίου ονόματος')
	meros.append(u'χαρακτήρας')
	meros.append(u'σύμβολο')
	meros.append(u'κατάληξη')
	meros.append(u'κατάληξη αρσενικών επιθέτων')
	meros.append(u'κατάληξη αρσενικών ουσιαστικών')
	meros.append(u'κατάληξη αρσενικών και θηλυκών ουσιαστικών')
	meros.append(u'κατάληξη επιρρημάτων')
	meros.append(u'κατάληξη θηλυκών ουσιαστικών')
	meros.append(u'κατάληξη ουδέτερων ουσιαστικών')
	meros.append(u'κατάληξη ρημάτων')

	str="|" #χαρακτήρας που θα μπει ανάμεσα
	return str.join(meros) 

# print str.join(meros)

import fixesstrings
...
pos1_tag = re.compile(u'\{\{(?P<pos>' + meros_olo + ')\|tr\|(?P<kleidi>[^\|\}]*)\}\}'