Il termine data non è nuovo per noi. È una delle cose principali insegnate quando si opta per l’Information Technology e i computer. Se riesci a ricordare, i dati sono considerati la forma grezza delle informazioni. Sebbene già presente da un decennio, il termine Big Data è un ronzio in questi giorni. Come evidente dal termine, carichi e carichi di dati, sono Big Data e possono essere elaborati in modi diversi utilizzando metodi e strumenti diversi per ottenere le informazioni richieste. Questo articolo parla dei concetti di Big Data, utilizzando le 3 V menzionate da Doug Laney, un pioniere nel campo del data warehousing che si ritiene abbia avviato il campo del Infonomics (Economia dell’informazione).

Prima di procedere, potresti voler leggere i nostri articoli sulle basi dei Big Data e sull’utilizzo dei Big Data per coglierne l’essenza. Potrebbero aggiungersi a questo post per ulteriori spiegazioni sui concetti di Big Data.

Big Data 3 Vs

I dati, nella loro forma enorme, accumulati con mezzi diversi sono stati archiviati correttamente in diversi database in precedenza e sono stati scaricati dopo un po’ di tempo. Quando è emerso il concetto che più sono i dati, più è facile reperire – informazioni diverse e rilevanti – utilizzando gli strumenti giusti, le aziende hanno iniziato a conservare i dati per periodi più lunghi. È come aggiungere nuovi dispositivi di archiviazione o utilizzare il cloud per archiviare i dati in qualsiasi forma i dati siano stati acquisiti: documenti, fogli di calcolo, database e HTML, ecc. Viene quindi organizzato in formati appropriati utilizzando strumenti in grado di elaborare enormi blocchi di Dati.

NOTA: l’ambito dei Big Data non è limitato ai dati raccolti e archiviati nei locali e nel cloud. Può includere dati da diverse altre fonti, inclusi ma non limitati a elementi di pubblico dominio.

Il Modello 3D dei Big Data si basa sulle seguenti V:

  1. Volume: si riferisce alla gestione dell’archiviazione dei dati
  2. Velocità: si riferisce alla velocità di elaborazione dei dati
  3. Varietà: si riferisce al raggruppamento di dati di insiemi di dati diversi, apparentemente non correlati

I paragrafi seguenti spiegano la modellazione dei Big Data parlando di ciascuna dimensione (ciascuna V) in dettaglio.

A]Volume di Big Data

Parlando di Big Data, si potrebbe intendere il volume come un’enorme raccolta di informazioni grezze. Sebbene ciò sia vero, si tratta anche dei costi di archiviazione dei dati. I dati importanti possono essere archiviati sia in locale che sul cloud, quest’ultimo è l’opzione flessibile. Ma hai bisogno di memorizzare e tutto?

Secondo un whitepaper pubblicato da Meta Group, quando il volume dei dati aumenta, parti di dati iniziano a sembrare inutili. Inoltre, afferma che dovrebbe essere conservato solo il volume di dati che le imprese intendono utilizzare. Altri dati possono essere scartati o se le aziende sono riluttanti a lasciar andare supposedly non-important data, possono essere scaricati su dispositivi informatici inutilizzati e persino su nastri in modo che le aziende non debbano pagare per l’archiviazione di tali dati.

ero solito supposedly unimportant data perché anch’io credo che dati di qualsiasi tipo possano essere richiesti da qualsiasi azienda in futuro – prima o poi – e quindi bisogna conservarli per un bel po’ di tempo prima di sapere che i dati non sono davvero importanti. Personalmente, scarico i dati più vecchi su dischi rigidi di altri tempi e talvolta su DVD. I computer principali e il cloud storage contengono i dati che ritengo importanti e che so che utilizzerò. Tra questi dati, c’è anche un tipo di dati usa e getta che potrebbe finire su un vecchio HDD dopo pochi anni. L’esempio sopra è solo per la tua comprensione. Non si adatta alla descrizione dei Big Data poiché la quantità è molto inferiore rispetto a ciò che le aziende percepiscono come Big Data.

B]Velocità nei Big Data

La velocità di elaborazione dei dati è un fattore importante quando si parla di concetti di Big Data. Ci sono molti siti web, soprattutto e-commerce. Google aveva già ammesso che la velocità di caricamento di una pagina è essenziale per un posizionamento migliore. Oltre alle classifiche, la velocità offre anche comfort agli utenti mentre fanno acquisti. Lo stesso vale per i dati trattati per altre informazioni.

Mentre si parla di velocità, è essenziale sapere che va oltre la larghezza di banda superiore. Combina dati facilmente utilizzabili con diversi strumenti di analisi. Per dati facilmente utilizzabili si intendono alcuni compiti a casa per creare strutture di dati facili da elaborare. La dimensione successiva – Varietà, diffonde ulteriore luce su questo.

C]Varietà di Big Data

Quando ci sono carichi e carichi di dati, diventa importante organizzarli in modo che gli strumenti di analisi possano elaborare facilmente i dati. Ci sono anche strumenti per organizzare i dati. Al momento dell’archiviazione, i dati possono essere non strutturati e di qualsiasi forma. Sta a te capire quale relazione ha con altri dati con te. Una volta individuata la relazione, puoi prendere gli strumenti appropriati e convertire i dati nella forma desiderata per l’archiviazione strutturata e ordinata.

Riepilogo

In altre parole, il modello 3D di Big Data si basa su tre dimensioni: dati UTILIZZABILI che possiedi; corretta etichettatura dei dati; e un’elaborazione più rapida. Se questi tre sono curati, i tuoi dati possono essere facilmente elaborati o analizzati per capire quello che vuoi.

Quanto sopra spiega sia i concetti che il modello 3D dei Big Data. Gli articoli collegati nel secondo paragrafo si riveleranno un ulteriore supporto se sei nuovo al concetto.

Se desideri aggiungere qualcosa, per favore commenta.