Big Data Analytics. Il manuale del data scientist
- Editore:
Apogeo Education
- Data di Pubblicazione:
- 15 Giugno 2017
- EAN:
9788891621856
- ISBN:
8891621854
- Pagine:
- 412
- Argomento:
- Raccolta e analisi dei dati
Descrizione Big Data Analytics. Il manuale del data scientist
Nell’era dei big data e agli albori della data driven economy, emerge una figura professionale in grado ?di analizzare, gestire, elaborare e comunicare i dati. ?È il data scientist, lo “scienziato dei dati”, che ha solide competenze in informatica, statistica, economia ed è in grado di far fronte alla sempre crescente complessità dei dati. Questo volume si propone come una guida completa ?sia per chi intenda intraprendere questa professione emergente, sia per chi, già esperto, desideri approfondire alcune tematiche. L’autore illustra le principali conoscenze relative ?alla gestione e all’analisi avanzata dei dati; descrive i big data e gli strumenti e le architetture che permettono ?di gestirli (Hadoop in particolare) e presenta i temi ?della data ingestion e dell’elaborazione con alcuni tool di analisi (Hive, Pig, Spark e R) le cui funzionalità sono illustrate anche tramite esempi commentati. ?Una parte è dedicata alla predictive analytics e mostra le tecniche per la creazione di modelli predittivi: dalla preparazione dei dati, alla scelta dell’algoritmo più adatto, alla valutazione delle performance. Il testo è un valido supporto per la comprensione ?dei concetti relativi all’analisi dei dati (big data o dati tradizionali), anche da parte del management aziendale che, dall’analisi avanzata, può trarre le informazioni utili ?ad assumere decisioni, a valutare rischi e disegnare strategie.
- Dati: un patrimonio importante
- Big data
- Le tecniche di analisi: come estrarre valore dai dati
- Hadoop: piattaforma e motori di calcolo
- Hadoop: basi di dati
- Gli strumenti per la “data ingestion”
- Elaborazione e analisi dei dati con Pig
- Spark
- R e l’analisi dei dati
- Metodologia per la predictive e prescriptive analytics
- Preparazione dei dati
- Gli algoritmi
- La valutazione dei modelli