Se effettui una ricerca sul web troverai molte definizioni del termine 'big data', ma la maggior parte sono concordi nel richiamare alla mente la presenza di insiemi di dati estremamente ampi, che possono essere analizzati per rivelare modelli, tendenze e associazioni, specialmente in relazione al comportamento e alle interazioni umane.
Ciò premesso, è anche vero che – come ci ricorda il sito internet eData Srl, le serie di dati sono così grandi che i metodi convenzionali di memorizzazione ed elaborazione dei dati non funzionano. Ma come procedere, allora?
Le fonti principali di big data possono essere raggruppate sotto le voci sociale (umano), macchina e transazionale.
Intuibilmente, i dati di provenienza sociale (umano) sono sempre più rilevanti per le organizzazioni, includendo ad esempio tutti i post dei social media, i video postati online, e così via. I dati da macchina provengono invece da ciò che può essere misurato dei software utilizzati, mentre quelli transazionali provengono dalle operazioni intraprese dall'organizzazione e, sicuramente, rappresentano la più tradizionale delle fonti di dati.
Le caratteristiche dei big data sono generalmente rappresentate da 5V (Volume, Varietà, Velocità, Veracità, Valore). Il più noto è probabilmente il primo, quello dei Volumi.
Per rendersi conto di quanto siano importanti i volumi dei big data è sufficiente rammentare come aziende come Apple e EBay misurano i propri big data in diversi petabyte. Ora, considerato che un tipico hard disk di un personal computer si misura in gigabyte, ne deriva che i depositi di big data di queste aziende contengono almeno i dati che potrebbero essere contenuti in 1 milione di PC, e forse anche da 10 a 20 milioni di PC.
La scala di tutto ciò è difficile da comprendere. Ed è probabilmente più utile considerare i tipi di dati che le grandi aziende tipicamente sono in grado di memorizzare.
Tramite le carte fedeltà che vengono strisciate alle casse, il consumatore condivide dettagli di tutti gli acquisti, quando, dove, come si paga, se si usa coupon, e così via.
Attraverso i siti web, per esempio, potrai condividere informazioni su ogni prodotto che hai guardato, ogni pagina che hai visitato, ogni prodotto che hai comprato. Sui social media potrai invece condividere informazioni come amici e contatti, post pubblicati, la tua posizione quando vengono fatti i post, fotografie (che possono essere scannerizzate per l'identificazione), qualsiasi altro dato che potresti scegliere di rivelare al mondo.
Per quanto attiene le compagnie telefoniche, i big data qui saranno i numeri che chiami, i messaggi che invii (che possono essere automaticamente scannerizzati per parole chiave), ogni luogo in cui il tuo telefono si trovava mentre era acceso (con una precisione di pochi metri), le tue abitudini di navigazione e i messaggi vocali.
Sempre a titolo di esempio, i provider potranno ottenere facilmente dati su ogni sito e ogni pagina che visiti, informazioni su tutti i download e tutte le e-mail (anche queste vengono regolarmente analizzate per fornire informazioni sui tuoi interessi), termini di ricerca che inserisci, e così via.