Chi crea modelli di Machine Learning e di analitiche avanzate sa molto bene che per realizzare e implementare modelli robusti ed efficienti è necessaria una potenza di calcolo davvero importante.
Per le prime fasi di test può essere sufficiente lavorare sulla propria macchina, ma con il crescere delle dimensioni del dataset la potenza necessaria per il training dei modelli può aumentare a dismisura.
Per aiutare data scientist e data analyst in questa attività sono presenti sul mercato diversi tool tra cui Google Colab.

Cos’è Google Colab?

Google Colab è uno strumento gratuito presente nella suite Google che consente di scrivere codice python direttamente dal proprio browser.
Una piattaforma online che offre un servizio di cloud hosting per notebook Jupyter dove creare ricchi documenti che contengono righe di codice, grafici, testi, link e molto altro. 

Una manna per chi si occupa di Data Science.Si può creare un documento Google Colab direttamente da Google Drive e, proprio come un qualunque documento in G Suite, può essere condiviso con altri utenti che hanno la possibilità di modificarlo e lasciare commenti direttamente nel notebook.
Il notebook Jupiter verrà poi eseguito su macchine virtuali di server Google. Ciò consente di svincolarsi dalla parte hardware e di concentrarci solamente sul codice Python e sui contenuti che si vuole integrare nel notebook.

Librerie, dati e risorse

Le macchine virtuali messe a disposizione in Google Colab ospitano un ambiente configurato che consente di concentrarsi sin da subito sui progetti di Data Science:  sono presenti numerose librerie Python, tra cui moltissime di Data Science come Keras e Tensorflow, si può usufruire di GPU e TPU per dare boost computazionali importanti ai nostri lavori, per esempio nell’implementazione di reti neurali con Tensorflow.
Importare dati in Google Colab è molto semplice: caricando manualmente i dati, oppure sfruttando i connettori messi a disposizione per accedere ai nostri dataset presenti per esempio nel nostro Google Drive. Google Colab inoltre è uno strumento molto flessibile e integrato con altri servizi cloud come ad esempio Big Query.In Google Colab le risorse che vengono messe a disposizione agli utenti sono limitate, e variano a seconda delle fluttuazioni nella domanda. Per esempio un giorno si potrebbe venire assegnati ad una macchina virtuale con 32 GB di RAM e il giorno successivo ad una macchina virtuale con 12 GB di RAM.
Se si ha bisogno di maggior stabilità, di macchine più performanti o di accedere a GPU e TPU più potenti, è possibile utilizzare la licenza a pagamento, ad oggi disponibile solamente negli Stati Uniti, presente la versione Pro di Google Colab.

Report facilmente realizzabili, disponibilità di moltissime librerie Python di Data Science già presenti, il boost computazionale offerto dalle GPU e TPU uniti alla semplicità di condivisione e collaborazione garantita G Suite: Google Colab è uno strumento utilissimo per tutti quelli che si occupano di Data Science.

Scopri di più

In Miriade lavoriamo tutti i giorni con le analitiche avanzate, siamo Premier Partner Google e siamo pronti a presentarti tutti i dettagli di questo tool, clicca qui per richiedere maggiori informazioni.