Σαν επιστήμονας δεδομένων μπορεί να είστε καλός στο αντικείμενό σας δουλεύοντας από την οθόνη του υπολογιστή σας. Ούτως ή άλλως η θέση εργασίας σας απαιτεί να μελετάτε προσεκτικά τεράστιους όγκους, συχνά, ετερόκλητων δεδομένων για να βρείτε ιδέες που μπορεί να αποδειχθούν χρήσιμες σε κάθε πτυχή μίας επιχείρησης, συμπεριλαμβανομένων του μάρκετινγκ, των logistics, και των ανθρώπινων πόρων.
του Thomas C. Redman, Ph.D*
Επίσης στις αρμοδιότητές σας είναι και το ξεσκαρτάρισμα των δεδομένων, η αντιμετώπιση ενδεχομένων κενών που συνδέονται με πληροφορίες και η διεξαγωγή συμπερασμάτων ακόμα και όταν τα στοιχεία είναι ελλιπή. Αλλά οι κορυφαίοι επιστήμονες δεδομένων ξέρουν ότι πρέπει να κάνουν περισσότερα. Αναγνωρίζουν ότι υπάρχουν αποχρώσεις και ζητήματα ποιότητας στα δεδομένα που δεν μπορούν να καταλάβουν από την οθόνη του υπολογιστή. Αναγνωρίζουν ότι ο κόσμος είναι γεμάτος με soft δεδομένα, σχετικές εικόνες, ήχους, μυρωδιές, γεύσεις και υφές που δεν έχουν ακόμη ψηφιοποιηθεί – και ως εκ τούτου δεν είναι διαθέσιμα για όσους εργάζονται στον υπολογιστή τους.
Σκεφτείτε λόγου χάρη την ηλεκτρισμένη ατμόσφαιρα σε μία πολιτική αναμέτρηση και το φόβο στα μάτια ενός στελέχους που έρχεται αντιμέτωπο με μια απρόσμενη απειλή. Ξέρουν ότι πρέπει να κατανοήσουν το ευρύτερο πλαίσιο, τα πραγματικά προβλήματα και τις ευκαιρίες, τον τρόπο με τον οποίο κινούνται οι φορείς λήψης αποφάσεων και πώς θα χρησιμοποιηθούν οι προβλέψεις τους. Οι κορυφαίοι επιστήμονες δεδομένων γνωρίζουν ότι ο μόνος τρόπος για να αποκτήσουν όλες αυτές τις πληροφορίες είναι να έρθουν σε επαφή με τον πραγματικό κόσμο. Έτσι περνούν το χρόνο τους στο δρόμο με φορτηγατζήδες, μιλούν με αυτούς που παίρνουν αποφάσεις σε πολιτικό ή κοινωνικό επίπεδο, περιπλανώνται σε ένα εργοστάσιο, προσποιούνται ότι είναι πελάτες, ζητούν από εμπειρογνώμονες σε άλλους κλάδους βοήθεια, και ούτω καθεξής.
Στην ουσία, ερευνούν εις βάθος τις διαδικασίες δημιουργίας δεδομένων και την πολυπλοκότητα του μηχανισμού μέτρησης. Ζητούν από ανθρώπους που έχουν εμπειρία την άποψή τους για το πώς θα χρησιμοποιηθεί το έργο τους, ποια είναι τα πιθανά αποτελέσματα, και τι μπορεί να πάει στραβά. Ας δούμε ένα παράδειγμα από την αγορά πετρελαίου. Όταν το πετρέλαιο είναι παχύ, είναι δύσκολο να το αντλήσετε από το έδαφος. Για να διευκολυνθεί αυτή η διαδικασία, οι εταιρείες ζεσταίνουν το πετρέλαιο πρώτα με ατμό. Η διαδικασία αυτή είναι δαπανηρή και πρέπει να γίνεται σύμφωνα με αυστηρές οικολογικές κατευθυντήριες γραμμές. Ένας καλός επιστήμονας δεδομένων μπορεί να λάβει υπόψη πολλούς παράγοντες –την υποκείμενη γεωλογία, την τρέχουσα θερμοκρασία του πετρελαίου, την ιστορία της παραγωγής, τη βελτιστοποίηση της ποσότητας ατμού. Αλλά ένας κορυφαίος επιστήμονας δεδομένων θα περάσει λίγο χρόνο και στην περιοχή που γίνεται η εξόρυξη
. Εκεί, θα παρατηρήσει ότι το μηχάνημα που χρησιμοποιείται για την εκτίμηση της θερμοκρασίας είναι μερικές φορές καθαρό, ενώ άλλες φορές καλύπτεται με λάσπη, με αποτέλεσμα να διαστρεβλώνεται το αποτέλεσμα και η θερμοκρασία να δείχνει πιο χαμηλή από ότι είναι. Αυτό οδηγεί στη χρήση περισσότερου ατμού. Εν συνεχεία ο επιστήμονας δεδομένων θα αντιμετωπίσει το πρόβλημα ζητώντας από τον τεχνικό να εισάγει καθαρό μετρητή.
Οι επιστήμονες δεδομένων είναι πάντα περίεργοι σχετικά με το πώς δημιουργούνται οι πληροφορίες. Σε αυτή την περίπτωση, η βελτιστοποίηση της ποσότητας του ατμού είναι σημαντική, αλλά η ποιότητα των δεδομένων είναι πιο καθοριστική και εξοικονομεί εκατομμύρια δολάρια. Σίγουρα δεν ξοδεύουν όλοι οι αναλυτές δεδομένων αρκετό χρόνο για να κατανοήσουν τη βαθύτερη πραγματικότητα του αντικειμένου που μελετούν. Μερικοί επικεντρώνονται πάρα πολύ στους αριθμούς. Πάρτε σαν παράδειγμα τις εκλογές στις ΗΠΑ. Για να καταλάβει κανείς ποιο θα είναι το αποτέλεσμα έπρεπε να είναι στο μυαλό των ψηφοφόρων. Επειδή δεν είναι εφικτό όμως κάποιος να έχει αυτή την πληροφόρηση χρησιμοποιήθηκαν δημοσκοπήσεις από πολλές πλευρές, από την εφημερίδα New York Times μέχρι την Princeton Εκλογική Επιτροπή, για να προβλέψουν ποιος θα κερδίσει. Αλλά οι περισσότεροι έπεσαν έξω. Οι επιστήμονες δεδομένων πρέπει να κατανοούν τα πλεονεκτήματα και τις αδυναμίες των πληροφοριών με μεγάλη λεπτομέρεια. Όπως αναφέρει και ο Nate Silver υπάρχουν πολλές δημοσκοπήσεις και οι κορυφαίοι αναλυτές ανησυχούν περισσότερο για το μη-δειγματοληπτικό σφάλμα από ότι για το μοντέλο της δημοσκόπησης. Μελετούν πόσο ακριβείς είναι οι τελευταίες δημοσκοπήσεις, αναρωτιούνται τι θα συνέβαινε αν οι άνθρωποι ψεύδονται στις δημοσκοπήσεις και λένε ότι είναι πιθανό να ψηφίσουν κάποιον υποψήφιο ενώ στο τέλος θα κατευθυνθούν σε άλλον. Λίγα από τα μέσα ενημέρωσης σχολίασαν τη δυναμική των συγκεντρώσεων του Trump και της Κλίντον. Ωστόσο οι κορυφαίοι αναλυτές διεξάγουν τέτοιες αναλύσεις για να αναπτύξουν πιο ασφαλή συμπεράσματα. Πέρα από αυτά αναζητούν και σχετικά στοιχεία. Μήπως οι Αμερικανοί δεν εμπιστεύονται την πολιτική δυναστεία, με αποτέλεσμα να μειώνονται οι πιθανότητες ενός υποψηφίου που ζητά εκλογές μετά την επί δύο θητείες προεδρία ανθρώπου από το κόμμα της; Μπορεί ο νικητής του Super Bowl να συσχετίζεται με το νικητή των εκλογών; Φυσικά, μια γερή δόση σκεπτικισμού θα πρέπει να υπάρξει με κάθε μία από αυτές τις αναλύσεις (είναι δύσκολο να δούμε οποιαδήποτε σχέση ανάμεσα σε ένα παιχνίδι ποδοσφαίρου και τις προεδρικές εκλογές), αλλά για τους αναλυτές τα δεδομένα και η εξερεύνηση του κόσμου από όσες πλευρές έχουν μεγάλο ενδιαφέρον. Δεν σταματούν να αναρωτιούνται πώς τα κομμάτια ταιριάζουν μεταξύ τους. Αν δεν κάνετε ενεργά αυτές τις διαδικασίες φροντίστε να τις εντάξετε στην καθημερινότητά σας.
Πρώτα δείτε πώς συλλέγονται τα δεδομένα
Ελέγξτε τον τρόπο με τον οποίο συλλέγεται η πληροφορία που επεξεργάζεστε. Κάντε το νόμο του Osborn “variables won’t; constants aren’t” σύνθημά σας. Τα όργανα μέτρησης γεμίζουν με άμμο, οι δημοσκοπήσεις δεν επαληθεύονται και οι ερευνητές έχουν σχεδιάσει με λάθος τρόπο τις διαδικασίες. Δεν μπορείτε να υποθέσετε ότι τα δεδομένα είναι αμερόληπτα και σωστά. Για αυτό εμπλακείτε προσωπικά
Γνωρίστε το χώρο που εργάζεστε
Γνωρίστε την επιχείρησή σας, μάθετε ποια είναι τα κρίσιμα ζητήματα που αντιμετωπίζει και ούτω καθεξής. Διαβάστε, μελετήστε και πηγαίνετε σε συνέδρια. Δημιουργήστε ένα εκτεταμένο δίκτυο από άτομα που βρίσκονται έξω από το πεδίο της επιστήμης των δεδομένων. Αναζητήστε βετεράνους και managers που θα σας εξηγήσουν πώς λειτουργεί η επιχείρηση. Ζητήστε τους να σας γνωρίσουν και σε άλλους ανθρώπους της επιχείρησης και χρησιμοποιήστε τους άτυπα σαν μέντορες.
Ενσωματώστε αυτές τις διαδικασίες στη μέρα σας
Κάντε αναλύσεις με ανθρώπους που μπορούν να σας βοηθήσουν να μελετήσετε στοιχεία που δεν είχατε σκεφτεί ή δεν είχατε συνδέσει μεταξύ τους. Συνδεθείτε με τους ανθρώπους που έχουν διαφορετικές οπτικές γωνίες. Δοκιμάστε το αρχικό σας αποτέλεσμα σε άλλους. Βεβαιωθείτε ότι το αποτέλεσμά σας είναι κατανοητό σε αυτούς που παίρνουν αποφάσεις. Οι κορυφαίοι επιστήμονες γνωρίζουν ότι ο στόχος είναι να λύσουν προβλήματα του πραγματικού κόσμου. Χρησιμοποιούν τα δεδομένα για να το πράξουν, αλλά δεν σταματούν εκεί.
* Ο Thomas C. Redman, Ph.D, “the data Doc” βοηθά τις εταιρείες, συμπεριλαμβανομένων πολλών του Fortune 100, να βελτιώσουν την ποιότητα των δεδομένων τους.
Πηγή: Harvard Business Review/ Ασφαλιστικό Marketing – Τεύχος Μαρτίου 2017