Risorse online
W
WALMART SALES ANALYTICS
Dataset Kaggle 2010–2012 · 45 Store · 81 Reparti · 421.570 righe
AI & Data Analytics · 2025/2026
Vendite Totali
$6.74B
421.570 settimane-dept registrate
Media Weekly Sales
$15.981
Per settimana per reparto
Holiday Lift
+7.1%
Holiday vs Non-Holiday
Store Totali
45
Tipi: A (22), B (17), C (6)
Reparti
81
Dept 92 = top vendite ($483.9M)
Stagionalità Mensile — Vendite medie per settimana ($K)
Novembre e Dicembre mostrano il picco natalizio. Gennaio cala al minimo annuale.
Vendite medie per Tipo Negozio
I negozi Tipo A dominano per volume, C per produttività/sqft
Top 10 Reparti per Vendite Totali
Dept 92 e 95 superano i $450M cumulati 2010–2012
Holiday vs Non-Holiday
Settimane con festività registrano vendite medie sistematicamente superiori
Serie Storica Settimanale
Vendite Settimanali Totali — 2010 a 2012 ($ Milioni)
I picchi di Novembre–Dicembre riflettono la stagionalità natalizia. Ogni punto è la somma di tutti i 45 negozi.
Distribuzione Annuale
Confronto vendite totali per anno di rilevazione
Temperatura vs Vendite
Campione di 400 punti — nessuna correlazione lineare netta
Performance per Negozio
Tutti i 45 Negozi
| Store | Tipo | Dimensione (sqft) | Vendite Totali ($M) | Media Settimanale | Performance |
|---|
Top 15 Negozi — Vendite Totali ($M)
Negozio 20 è il leader assoluto con $301.4M cumulati
Effetto MarkDown sulle Vendite
Confronto Con / Senza MarkDown — Media Vendite Settimanali per Reparto
MarkDown2 e MarkDown4 mostrano i lift più elevati (+9.3% e +9.9%). MarkDown1 e MarkDown5 hanno impatto minore.
Best Performer
MarkDown4 → +9.9%
Media $17.026 vs $15.489 senza promozione. Raccomandato in Q4.
Strategia Suggerita
Concentrare MD4 in Nov–Dic.
MD2 per mid-season. MD1/MD5 selettivi.
MD2 per mid-season. MD1/MD5 selettivi.
Script Python — analisi_Walmart.py
File
analisi_Walmart.py
Pipeline
Descrittiva → Predittiva → Prescrittiva
Modelli ML
Random Forest + Ridge Regression
Output
3 tavole PNG (150 DPI)
analisi_Walmart.py
Materiale Didattico — AI and Data Analytics
Corso
AI and Data Analytics
Docente
Roberto Fantaccione
Corso di Laurea
Ingegneria Gestionale
Anno Accademico
2025/2026
Struttura del Corso
I moduli coprono l'intero ciclo dell'analisi dei dati, dall'IA generativa ai modelli predittivi e prescrittivi.
Pipeline Analisi Dati — Workflow del Progetto Walmart
Il progetto applica le tre fasi del corso al dataset reale Kaggle
📊
Tavola 1
Analisi Descrittiva
Serie storiche, distribuzioni, correlazioni
Serie storiche, distribuzioni, correlazioni
🤖
Tavola 2
Analisi Predittiva
Random Forest vs Ridge
R²=0.916
Random Forest vs Ridge
R²=0.916
🎯
Tavola 3
Analisi Prescrittiva
KPI, raccomandazioni,
piani di azione
KPI, raccomandazioni,
piani di azione
