fbpx
5 mins

Data wrangling e data preprocessing: modificare, pulire e preparare un dataset

Dopo aver letto un’articolo molto curioso su Forbes ho deciso di scrivere qualche riga sul data preprocessing e su come manovrare dati prima ancora di implementare tutte le possibili tecniche di machine learning. Secondo l’articolo in questione, questa fase occupa circa il 60% del tempo di chi lavora in questo settore.   Con il termine data preprocessing ci si ...

4 mins

Cos’è la Data Science e cosa fa un Data Scientist ?

Un mondo di dati Una ricerca del 2012 dell’EMC ha stimato il numero di dati prodotti dall’uomo fino al 2005 in 130 exabyte. Un exabyte corrisponde a un miliardo di gigabyte, per rendere l’idea di quanto grande sia questo numero basta pensare che 5 exabyte corrispondono a un documento di testo contenente ogni frase, discorso o discussione mai ...