Antes de entrarmos no tópico sobre Banco de Dados, precisamos entender quais são os tipos de dados que existem. Caso você já tenha conhecimento sobre os diferentes tipos de dados e sua análise para geração de informação e inteligência, fique à vontade para pular para o próximo capítulo.
Atualmente, os dados são gerados e transformados em informação, que, por sua vez, são transformados em conhecimento e inteligência.
Transformar dados em inteligência é o núcleo da Transformação Digital que é responsável por gerar trazer muito valor às organizações.
De acordo com o Wikipedia, o surgimento da Pirâmide DIKW (Data, Information, Knowledge, Wisdom, em inglês, ou Dados, Informação, Conhecimento, Inteligência) teve seus primórdios em1955. quando Kenneth Boulding apresentou uma variação da mesma hierarquia conhecida como “Sinais, Mensagens, Informação e Conhecimento”. Mas também referem-se a Nicholas L. Henry, professor americano que publicou, em 1974, um artigo diferenciando dados, informações e conhecimento, e explicou o conceito de Gerenciamento de Conhecimento em um artigo de jornal.
Referência da imagem aqui. Adaptação: Mariana Carvalho.
Os dados podem ser classificados em quatro categorias:
1. Estruturados: dados que possuem um formato definido, uma estrutura, por exemplo salvos em uma planilha com linhas e colunas (tabela)
a. Exemplo: banco de dados (Oracle, SAP, SQL)
2. Semi-estruturados: dados que estão agrupados mas não necessariamente seguem a estrutura de um banco de dados relacional como os citados acima, podendo conter tags e marcações, e criando relações com registros e hierarquias dentro do banco de dados
a. Exemplo: arquivos XML
3. Quasi-estruturados: dados textuais com formatos irregulares, os quais podem ser formatados com ferramentas de software, dependendo de tempo e do esforço
a. Exemplo: clickstream, ou clickpath, que contém informações sobre as páginas (e ordem das páginas) visitadas pelo usuário (informações incluem: páginas visitadas, tempo em cada página, entrada e saída do site)
4. Dados não estruturados: dados que não possuem um modelo de dado e não estão organizados em nenhum formato específico
a. Exemplo: imagens, vídeos, PDF, apresentações e e-mails
Assim, cada tipo de dado deve ser armazenado de uma forma para que não perca suas características naturais.
De acordo com um artigo recente da revista Forbes, 90% dos dados atuais são considerados não-estruturados (e esse tipo de dado vem crescendo 65% a cada ano!). Pensando em nosso dia a dia (sem contar os milhões de dados gerados por empresas e consumidores a cada segundo), imagine que todo o conteúdo que criamos em nosso Twitter, Facebook, Instagram (cada story que você compartilha e fica salvo na sua pasta de “Arquivo” é um dado não-estruturado que deve ser armazenado em algum lugar e, por fim, recuperado a cada vez que você o compartilha), deve ser armazenado com segurança em algum lugar.
Essa é a importância de se estabelecer uma infraestrutura robusta que seja capaz de trazer performance, agilidade, escalabilidade e também a possibilidade de analisar esses dados e transformá-los em informações, gerando valor ao negócio.
Sugestões de livros:
Inteligência Competitiva em Tempos de Big Data, de Elisabeth Gomes e Fabiane Braga
Think Stats, de Allen B. Downey, da Editora O’Reilly
Sugestão de certificação:
VMware Certified Associate Digital Transformation, da VMware
Caso conheça outras indicações de livros, certificações ou cursos, fique à vontade para deixar nos comentários. Ficarei feliz em adicionar a esse post!
Esse texto faz parte do Guia de Infraestrutura de Tecnologia de Informação publicado no medium, no dev.to, e na Open Library. Para checar todos os capítulos, clique aqui e acesse a Introdução.
Próximo capítulo: Banco de Dados
Top comments (0)