Τεχνολογία Διάστημα Επιστήμες

Μια ανοιχτή πολιτική δεδομένων για το CERN… και ένα σημαντικό βήμα στη διατήρηση της ψηφιακής κληρονομιάς του Large Hadron Collider

Το CERN και η κοινότητα της Υψηλής Ενέργειας Φυσικής (HEP) γενικά έχουν μια μακρά παράδοση να εφαρμόζουν τις έννοιες της Ανοικτής Επιστήμης ήδη πολύ πριν επινοηθεί ο σημερινός όρος «Ανοιχτή Επιστήμη». 

Λόγω του μεγέθους και της πολυπλοκότητας των μεγάλων έργων επιταχυντή σωματιδίων και ανιχνευτών, η κοινότητά μας αναγκάστηκε από νωρίς να ενοποιήσει την προσπάθεια και να μοιραστεί βασικές υποδομές όπως επιταχυντές, υπολογιστικούς πόρους (τόσο στο CERN όσο και σε παγκόσμια εργαστήρια συνεργατών) και επίσης σημαντικές επενδύσεις λογισμικού. Αυτή η κουλτούρα, σε σύγκριση με άλλες επιστήμες, δημιούργησε μια πρώιμη συνοχή σε ολόκληρη την κοινότητα HEP που διευκόλυνε τη συνεργατική ανάπτυξη ανοιχτού λογισμικού τις δεκαετίες και επέτρεψε μια ανοιχτή ανταλλαγή μεθόδων ανάλυσης δεδομένων και επιστημονικών αποτελεσμάτων.

Πολλαπλά κίνητρα

Στο παρελθόν, το ενδιαφέρον για ανάλυση δεδομένων μεγάλου όγκου και η διαθεσιμότητα κατάλληλων υπολογιστικών πόρων περιοριζόταν σε λίγους μόνο επιστημονικούς τομείς. Ωστόσο, με την έλευση των εμπορικών Big Data και Machine-Learning, και οι δύο γίνονται όλο και πιο συνηθισμένοι. Η αξία του περαιτέρω ανοίγματος της πρόσβασης στα δεδομένα μας (και συνεπώς η επέκταση του επιστημονικού διαλόγου) πέρα ​​από το HEP φαίνεται σήμερα από πολλούς. Κατά συνέπεια, οι οργανισμοί χρηματοδότησης απαιτούν όλο και περισσότερο αυτό το βήμα του ανοίγματος της πρόσβασης σε δεδομένα για έργα που χρηματοδοτήθηκαν πρόσφατα. Για να βοηθήσετε αυτήν την κίνηση, το CERN Open Data Portal [ http://cern.ch/opendata] έχει αναπτυχθεί από το Τμήμα Πληροφορικής με συνεισφορές πολλών συνεργατών σε ολόκληρο το CERN και πέρα ​​από αυτό και ήδη σήμερα παρέχει πρόσβαση σε περισσότερα από 2 PB δεδομένων από LHC και άλλα πειράματα CERN σε μια ενιαία, επιμελημένη, αναζητούμενη διαδικτυακή εφαρμογή.

Τα ανοιχτά διαθέσιμα σύνολα δεδομένων διευκολύνουν ήδη τη δημιουργία πιο ρεαλιστικής προσέγγισης και αποτελεσματικότερου εκπαιδευτικού υλικού και συνδέστε εμπειρογνώμονες μηχανικής μάθησης στο HEP με την ταχεία εξέλιξη σε αυτόν τον τομέα εκτός [ https://www.kaggle.com/c/higgs- boson , https://www.kaggle.com/c/flavours-of-physics ]. Επίσης, θεωρητικές ομάδες εκτός των συνεργασιών LHC έχουν αποδείξει το αυξανόμενο ενδιαφέρον και τα υπολογιστικά τους μέσα συμπληρώνοντας τα αποτελέσματα συνεργασίας LHC με ανεξάρτητες μελέτες. Αυτό δείχνει περαιτέρω την αυξημένη επιστροφή στην κοινότητα γενικά ανοίγοντας την πρόσβαση σε δεδομένα CERN.

Άνοιγμα ομάδας εργασίας πολιτικής δεδομένων

Εκτός από το άνοιγμα και την κοινή χρήση , η κοινότητα του HEP εκτιμά ιδιαίτερα τη συμπληρωματικότητα συγκρίνοντας τα διαφορετικά σχέδια ανιχνευτών και προσεγγίσεις ανάλυσης που αναπτύχθηκαν από ανεξάρτητες συνεργασίες σε επικαλυπτόμενους ερευνητικούς τομείς. Σε αυτό το περιβάλλον, πρέπει να εισαχθεί προσεκτικά μια κοινή δήλωση πολιτικής, όπως “Ανοικτή πολιτική δεδομένων”, ώστε να μην διαταραχθεί ο φιλικός ανταγωνισμός μεταξύ ενεργών συνεργασιών ταυτόχρονα.

Μετά από προπαρασκευαστικές συζητήσεις στο Worldwide LHC Computing Grid [ https://cern.ch/wlcg https://indico.cern.ch/event/858039/ ] και παρουσίαση στην Επιτροπή Επιστημονικής Πολιτικής, η Διεύθυνση CERN ανέθεσε στις αρχές του έτους μια ομάδα εργασίας σε όλα τα πειράματα του LHC για να προτείνει μια δήλωση εκ μέρους της κοινότητας του LHC και ενδεχομένως να υιοθετηθεί αργότερα από άλλα πειράματα.

Η Ομάδα Εργασίας Open Data – με εκπροσώπηση από τη διαχείριση φυσικής και υπολογιστικής πειράματος του LHC, τη μονάδα βιβλιοθήκης CERN και το τμήμα IT CERN – συναντήθηκε τους τελευταίους μήνες και συνέταξε δήλωση δημόσιας πολιτικής που εκφράζει μια κοινή άποψη σχετικά με τα οφέλη των ανοιχτών δεδομένων και τη δέσμευση να ακολουθήσουμε μια κοινή προσέγγιση για το άνοιγμα των δεδομένων που σχετίζονται με ανάλυση. Τα πειράματα αντάλλαξαν περαιτέρω πρακτικές εκτιμήσεις, συνέταξαν ένα σχέδιο εφαρμογής για τις επερχόμενες κυκλοφορίες δεδομένων και συμφώνησαν να επανεξετάσουν αυτό το σχέδιο μέσω της ομάδας εργασίας Open Data σε όλες τις περιόδους λειτουργίας του LHC.

Το σχέδιο πολιτικής στοχεύει στην αντιμετώπιση πιθανών κινδύνων για τα μοντέλα χρηματοδότησης της συνεργασίας και στην άμβλυνση πιθανών αρνητικών επιπτώσεων από επιστημονικά αποτελέσματα που ενδέχεται να μην ακολουθούν τον αυστηρό μηχανισμό δημοσίευσης στο πλαίσιο των συνεργασιών του LHC. Και οι δύο κίνδυνοι αντιμετωπίζονται μέσω του προγραμματισμένου ανοίγματος στατιστικών σχετικών πειραματικών συνόλων δεδομένων και μιας συμφωνημένης περιόδου εμπάργκο που ευνοεί την αρχική εκμετάλλευση δεδομένων από τη συνεργασία που δημιούργησε τον ανιχνευτή και συνέλεξε τα δεδομένα.

Τελευταίο αλλά όχι λιγότερο σημαντικό, μια βιώσιμη πολιτική για την πρόσβαση δεδομένων από την κοινότητα γενικά θα απαιτήσει ορισμένους ειδικούς υπολογιστικούς πόρους για να παραμείνει διαθέσιμος. Μια συγκεκριμένη συζήτηση σχετικά με τον τρόπο κατανομής των απαραίτητων πόρων ανάπτυξης και μέσων επιτρέπει πλέον τη δήλωση κοινής πολιτικής.

Το προκύπτον σχέδιο πολιτικής έχει πρόσφατα διαβιβαστεί στους αντίστοιχους φορείς συνεργασίας και θα πρέπει να εγκριθεί πλήρως από τα πειράματα του LHC αργότερα αυτόν τον μήνα.

πηγή

Σχετικές αναρτήσεις

Στο εσωτερικό μιας μαύρης τρύπας

e-enimerosi

Η προσαρμογή στην εξίσωση της γάτας του Σρέντινγκερ θα μπορούσε να ενώσει τη σχετικότητα του Αϊνστάιν και την κβαντική μηχανική.

e-enimerosi

Το διαστημόπλοιο Starliner της Boeing δεν θα πραγματοποιήσει ακόμη ιδιωτικές αποστολές.

e-enimerosi