Εδώ και κάποιες εβδομάδες έχει ξεκινήσει η λειτουργία της ελληνικής DBpedia.  Η DBpedia είναι ένα project για την εξαγωγή, διασύνδεση και επαναχρησιμοποίηση δομημένης πληροφορίας διαμέσου του Web από την Wikipedia. Τα δεδομένα που αντλούνται μπορούν να είναι αντικείμενο επεξεργασίας από λογισμικό και να διασυνδεθούν με οποιοδήποτε τρόπο, προσφέροντας δυνατότητες για απίστευτες εφαρμογές. Η δημιουργία αντίστοιχης βάσης με δεδομένα από την ελληνική βικιπαίδεια (και βεβαίως διασυνδεδεμένα με τα αντίστοιχα από την αγγλική) πρώτα από όλα μπορούν να μας οδηγήσουν σε:

  1. καλύτερη διαχείριση και οργάνωση της πληροφορίας εντός της βικιπαίδειας,
  2. ενημέρωση και διορθώσεις για αναντιστοιχίες πληροφοριών σε σχέση με την αγγλική ή ακόμη και άλλες πηγές πληροφοριών,
  3. χρήση τους από εφαρμογές τρίτων web based ή όχι εφαρμογών, διαμοιράζοντας τις πληροφορίες της βικιπαίδειας σε μεγάλο αριθμό ανθρώπων ακόμη και αν δεν την επισκεφτούν άμεσα, γεμίζοντας στην ουσία το διαδίκτυο με συνδέσμους προς άρθρα της βικιπαίδειας.

Το ελληνικό project διοργανώνεται από το Πρόγραμμα Μεταπτυχιακών Σπουδών του Τμήματος Μαθηματικών του ΑΠΘ που χρηματοδοτείται και εδράζεται στο Δήμο Βέροιας Η δημιουργία της πρώτης έκδοσης της ελληνικής DBpedia έγινε από τους μεταπτυχιακούς φοιτητές του ΠΜΣ στην Επιστήμη του Διαδικτύου στα πλαίσια της εργασίας τους για το μάθημα “Επεξεργασία Πληροφορίας στο Διαδίκτυο” με επιβλέποντα τον δρ. Χαράλαμπο Μπράτσα. Σημειώνω ότι ακόμη και η δημιουργία του τοπικού project είναι αρκετά πρωτοποριακή, καθώς πρόκειται για μόλις την τρίτη διεθνή έναρξη πλην της αγγλικής,  αλλά είναι ήδη σε περισσότερο δυναμική πορεία.

Σύντομα οι μεταπτυχιακοί φοιτητές θα ενημερωθούν σχετικά με την λειτουργία των προτύπων και ιδιαίτερα των κουτιών πληροφοριών (infoboxes) που είναι και στο άμεσο ενδιαφέρον της DBpedia. Αργότερα θα υπάρχει έντονη και αμφίδρομη διοχέτευση ιδεών και παρατηρήσεων με σκοπό την παράλληλη βελτίωση.

Η ουσία και η χρησιμότητα του παραπάνω project, είναι όπως τέθηκε σε ένα παράδειγμα από χρήστη της ΒΠ, ότι η dbpedia θα τραβά συγκεκριμένες πληροφορίες από άρθρα της wikipedia και θα τις αποθηκεύει σε δομημένη μορφή (σε μορφή δενδρική σε κάποιο object ή οντολογία), ώστε να μπορεί να γραφεί κώδικας που να χρησιμοποιεί αυτές τις πληροφορίες.. πχ. θα μπορούσε να γραφεί κώδικας για κινητά τηλέφωνα που χρησιμοποιώντας το gps στίγμα του κινητού να καταλαβαίνει σε ποια πόλη είσαι και να εμφανίζει συνοπτικές πληροφορίες για την πόλη. Θα ήταν δύσκολο να αντλήσει συγκεκριμένες πληροφορίες (π.χ. αριθμός κατοίκων, υψόμετρο, ενδεικτική φωτογραφία πόλης, σημαία πόλης κλπ) από την wikipedia (κάνοντας parse το κείμενο της wikipedia) αλλά θα είναι εύκολο να παίρνει τα δεδομένα δομημένα κατευθείαν από το dbpedia.

Αυτό το πράγμα δεν θα μπορούσε να γίνει μόνο μέσα από την Βικιπαίδεια, κυρίως επειδή τα meta-data θα πρέπει να  είναι σε ένα machine-readable format. Για παράδειγμα οι πληροφορίες για κάθε χώρα υπάρχουν στο αντίστοιχο infobox, αλλά για να γίνει χρήση από κάποιο πρόγραμμα, θα πρέπει να μπορέσει να τα διαβάσει πρώτα. Αυτό είναι που κάνει η dbpedia, εξάγει τα δεδομένα από τα αντίστοιχα infoboxes και τα διανέμει με μορφή που μπορούν να διαβάσουν τα προγράμματα. Μόνο σε πολύ μικρό βαθμό τα άρθρα της ΒΠ μπορούν να έχουν ενσωματωμένα μεταδεδομένα (π.χ. microformats). Άλλες μορφές (RDF/XML, JSON κλπ.) αλλά και ευρετήρια, αναζήτηση και συνδυασμός των δεδομένων, δεν είναι δυνατό να υπάρχουν χωρίς σχετική επέκταση του λογισμικού (π.χ. Semantic MediaWiki) κάτι που είναι αρκετά δύσκολο, ακριβό και πολύπλοκο να γίνει. Αλλά η DBpedia δεν κάθεται απλά στην εξαγωγή των δεδομένων από την ΒΠ: μέσω αυτής μπορεί να γίνει συνδυασμός  δεδομένων και από άλλες πηγές από όπου εξάγονται παρόμοιες πληροφορίες.

the friend of a friend (foaf) project The Friend of a Friend (FOAF) project is about creating a Web of machine-readable homepages describing people, the links between them and the things they create and do.