banner-materie

Scavare nel web: introduzione al Data Mining

Il data mining nasce alla fine degli anni Ottanta del secolo scorso, nel momento in cui si sono resi disponibili strumenti per l’organizzazione flessibile di grandi quantità di dati (i cosiddetti database relazionali). È in quest’ultimo decennio, però, che tali tecniche hanno registrato un notevole incremento nell’uso e nelle applicazioni, come conseguenza del fenomeno dei Big Data, e dello sviluppo dei tanti servizi online ― fra i quali anche i social media ― che producono profitto proprio grazie ai dati degli utenti.

Il data mining ha infatti natura esplorativa, e serve ad inferire e validare modelli di relazioni fra dati, con scopi solitamente applicativi, quali: studiare i comportamenti degli utenti di un servizio, analizzare i temi di discussione intorno ad una parola chiave, o le opinioni espresse dagli utenti del web intorno ad un oggetto o un argomento (sentiment analyis).

A tale scopo, le maggiori aziende mondiali hanno iniziato ad utilizzare R, un software open source distribuito liberamente (R Project): fra le più importanti, ricordiamo Facebook, Twitter, Google, ma anche Ford, Novartis, McKinsey, Microsoft e Uber. Esistono distribuzioni di R (sempre libere) mantenute da Microsoft (Microsoft R Application Network – MRAN) e da Oracle (R Technologies).

Il workshop avrà un taglio teorico-pratico e introdurrà i partecipanti agli usi e alle procedure del data mining nell’ambito dello studio del web, ma anche ai fondamenti del linguaggio di R.

Obiettivo del workshop è fornire una panoramica della metodologia e delle tecniche di data mining e introdurre all’utilizzo di R per la raccolta, l’analisi e la validazione dei modelli, attraverso basi dati di esercizio e casi reali.

Cosa si impara

  • Origini e applicazioni del Data Mining;
  • Cenni sul Text Mining;
  • Panoramica di R, interfacce, funzioni e procedure per il data mining e il text mining;
  • Procedure per la raccolta, l’importanzione e l’organizzazione dei dati, con particolare attenzione alla raccolta dei dati dei social media (Instagram, Twitter, Facebook);
  • Le principali fasi e procedure di analisi dei dati, mediante esempi di ricerca.

La docente

vardonega

Agnese Vardanega, PhD, è professoressa associata presso l’Università degli studi di Teramo.

Specializzata in Metodologia della ricerca sociale, da diversi anni si occupa di processi sociali sul web, e di metodi e tecniche di ricerca per il web.

Insegna Sociologia e Metodologia della ricerca sociale, e ha all’attivo diverse pubblicazioni in manuali, volumi e atti di convegni. Vive e lavora a Teramo.

×