House Prices

In alto a distribuzione dei campioni di partenza e normalizzata. In basso grafici di dispersizione di due feature.

Diagrammi box-plot di alcune feature.

A sinistra una matrice di correlazione, a destra l'importanza Gini delle feature.

Tabella riassuntiva dei risultati dei vari modelli. In basso lo score e il posizionamento nella competizione.
Tipologia: progetto universitario
Tecnologie: Python, Kaggle, Visual Studio Code
Notebook realizzato per una competizione su Kaggle, mirato a prevedere il prezzo della case di un dataset fornito, basandosi sulle loro caratteristiche e su un training set predefinito. L’analisi ha incluso l’esplorazione dei dati, il preprocessing e la selezione di modelli di regressione avanzati, confrontati con metriche appropriate. Il risultato ha portato al 100° posto, posizionandosi tra il top 3% dei partecipanti.