Στo πλαίσιo του μαθήματος δίνεται έμφαση σε πρακτικά ζητήματα σχετικά με την εξόρυξη και ανάλυση μεγάλου όγκου δεδομένων. Οι συμμετέχοντες εξοικειώνονται με διαφορετικές μορφές δεδομένων και με τις μεθόδους αποθήκευσης, πρόσβασης και επεξεργασίας πληροφοριών. Η ανάλυση δεδομένων αποσκοπεί στην απόκτηση γνώσεων και δεξιοτήτων οι οποίες βοηθούν στη σύνδεση και επεξεργασία βάσεων δεδομένων, στην εξόρυξη και αποθήκευση δεδομένων αλλά και στη διαμόρφωση κατάλληλων αρχείων ώστε να αναζητηθούν απαντήσεις σε ερευνητικά ερωτήματα, διατυπωμένα από τους ίδιους τους φοιτητές. Παράλληλα, στο μάθημα γίνεται διαχείριση λιγότερο προσβάσιμων δεδομένων, μετατρέποντας τα δύσκολα στη χρήση αρχεία PDF σε χρήσιμες πληροφορίες.

Ο σκοπός του μαθήματος, συμπεριλαμβάνει βασικές αρχές οπτικοποίησης και απεικόνισης δεδομένων μέσω δημιουργίας γραφημάτων, καθώς και την αξιοποίηση από τους συμμετέχοντες, γνωστών εργαλείων όπως η Google και το StackOverflow, για την επίλυση προβλημάτων προγραμματισμού. Τελικός στόχος του μαθήματος, αποτελεί η εξοικείωση των συμμετεχόντων με τον προγραμματισμό και την επεξεργασία (μεγάλων) δεδομένων, και γι΄αυτό παρουσιάζονται ενότητες και εργαλεία που περιλαμβάνουν: Python, βασική στατιστική ανάλυση, HTML, CSVs, APIs, SQL, APIs, CSVs, κανονικές εκφράσεις, PDF processing, pandas, BeautifulSoup, Jupyter/IPython Notebooks, git/GitHub, StackOverflow, data cleaning, command line tools και άλλα.

Το εργαστηριακό κομμάτι του μαθήματος περιλαμβάνει τις παρακάτω ενότητες:

  • Δημιουργία και διαχείριση βάσεων δεδομένων.
  • Επεξεργασία βάσεων δεδομένων.
  • Εξόρυξη δεδομένων από διαδικτυακούς τόπους.
  • Βιβλιοθήκες εγγράφων, κανονικές εκφράσεις.
  • Δημιουργία οπτικοποιήσεων.

Με την επιτυχή ολοκλήρωση του μαθήματος οι φοιτητές θα είναι σε θέση να γνωρίζουν:

  • Να βρίσκουν και να αποθηκεύουν δεδομένα.
  • Αρχές προγραμματισμού για την επεξεργασία (μεγάλων) δεδομένων.
  • Οπτικοποίηση και απεικόνιση μεγάλου όγκου δεδομένων μέσω δημιουργίας γραφημάτων.
  • Να χρησιμοποιούν τα δεδομένα για την ερμηνεία συμπεριφορών και τάσεων.
Κωδικός Μάθημα Εξάμηνο Υ / ΕΥ Θεωρία (ώρες) Εργαστήριο (ώρες) ECTS
301Y Εισαγωγή στη Διαφήμιση 3 Υ 4 5
302Y Δημόσιες Σχέσεις 3 Υ 4 5
303Y Ανάλυση Δεδομένων και Επικοινωνία II 3 Υ 4 5
304Y Επικοινωνία Ανθρώπου Υπολογιστή I 3 Υ 4 5
305Y Μάρκετινγκ στα Μέσα Κοινωνικής Δικτύωσης ΙΙ 3 Υ 2 2 5
306Y Παραγωγή Οπτικοακουστικών Μέσων 3 Υ 2 2 5