I Big Data sono una realtà e la professionalità del data scientist è tanto ambita quanto rara sul mercato del lavoro. All'interno delle aziende, infatti, gli investimenti si concentrano sempre più sull'analisi dei dati, con lo scopo di prendere decisioni efficaci e migliorare prodotti, servizi e vendite. Questo manuale presenta in modo semplice e concreto i Big Data a chi non ha particolare esperienza ma vuole passare velocemente dalla teoria alla pratica. Per questo viene introdotto KNIME, uno strumento open source e gratuito dotato di un'interfaccia grafica che ne semplifica l'utilizzo e permette anche a chi non scrive codice di sfruttare i principali algoritmi di machine learning. Dopo aver definito cosa sono - e non sono - i Big Data, attraverso esempi pratici e tutorial viene spiegato come costruire cluster per organizzare dati e come creare modelli di predizione. Infine vengono introdotti argomenti più avanzati come il riconoscimento e l'analisi del linguaggio umano, e l'estensione delle funzionalità di KNIME con R e Python. Una guida per manager, professionisti e studenti, ma più in generale per chiunque voglia iniziare a lavorare con i Big Data apprezzandone le opportunità e comprendendone le criticità.
All' inizio ero scettico riguardo la scelta dell'autore di utilizzare KNIME come tool principale. Ma devo dire che mi sono dovuto ricredere. Infatti il fatto che il tool possa essere sfruttato (anche) senza scrivere codice fa si che ci si possa concentrare verso quelli che sono i concetti del machine learning. Intendiamoci, questo può essere un pregio o un difetto del libro a seconda dell'utenza, ma devo dire che per un neofita è davvero un'ottimo punto di partenza. La natura GUI di KNIME permette infatti di implementare algoritmo di ML anche complessi tramite semplici collegamenti tra nodi e questo rende ancora più chiaro il procedimento logico che seguono quando per ottenere lo stesso output su R o Python bisognerebbe scrivere decini di righe di codice. Infine il concetto di Big Data e tutto quello che orbita intorno ad esso sono spiegati in maniera davvero chiara ed efficace.
Consigliato ad un noefita nel campo del Data Analytics e della programmazione.
Libro molto simile al suo più recente Data Analytics per tutti. Ci sono delle differenze però. In paricolore sono diversi nei contenuti il primo capitolo e l'ultimo capitolo: nel primo capitolo introduce il concetto di big data, nell'ultimo capitolo spiega come usare un'estensione di Knime per gestire i Big Data. In tutto onestà mi è piaciuto di più Data Analytics per tutti, dove parla anche di data visualization e storytelling coi dati, mi è sembrato un percorso più completo, ma entrambi i libri condividono l'ottima parte centrale di introduzione al machine learning.