Modelagem de dados: o que é, tipos e etapas do processo
Equipe de conteúdo - PM3

Equipe de conteúdo – PM3

9 minutos de leitura

10 Perguntas e respostas em entrevistas para Analista de Dados

A modelagem de dados é uma etapa crucial na estruturação de modelos de bancos de dados. Não é novidade que coletar dados é essencial para um negócio. Mas saber estruturá-los para fazer uma análise correta das informações, é o que realmente faz diferença. 

Os sistemas criados a partir da modelagem de dados servirão para armazenar informações, estabelecer relações entre os elementos dos bancos de dados e analisar informações de acordo com os requisitos da empresa. Esse processo auxilia o negócio a buscar os insights mais relevantes para a tomada de decisões estratégicas e a criar um banco de dados funcional para a empresa.

Neste artigo, aprenda o que é modelagem de dados, a importância de criar um modelo de dados, as etapas do processo e os tipos de modelagem mais utilizados por arquitetos de dados. Acompanhe!

O que é modelagem de dados?

A modelagem de dados representa a criação de um diagrama simplificado pensado para estruturar o armazenamento e o mecanismo de fluxo de informações relevantes para uma empresa que deseja construir um banco de dados. Em outras palavras, o profissional responsável pela modelagem, precisará desenvolver um diagrama visual sobre como os dados daquele projeto ou empresa serão armazenados no sistema sendo desenvolvido. 

Essa estrutura precisa conter, por exemplo, os formatos que esses dados terão, quais relações estabelecem entre si, entre outros aspectos lógicos e funcionais importantes para os objetivos da criação do banco de dados. Assim, esse processo é feito anteriormente à criação do sistema de banco de dados (software, plataforma, ferramenta ou aplicativo) e requer uma análise de requisitos para entender qual é o objetivo da modelagem e como o banco de dados será utilizado. 

Dessa forma, o modelo de dados precisa ser bem feito e conter os requisitos pontuados pelo cliente de forma inteligente, funcional e estratégica para a organização.

Lembrando que não existem regras sobre como deve ser um modelo de dados, já que é importante considerar as necessidades únicas de cada empresa/projeto na hora de pensar na estrutura desse sistema.

Por que a modelagem de dados é importante?

Como você pôde perceber, a modelagem de dados é uma etapa crucial no desenvolvimento de um banco de dados, pois é o momento de entender os requisitos e objetivos da empresa para a estruturação desse sistema. Além disso, esse processo é feito para estabelecer todos os atributos necessários para que o banco de dados armazene informações relevantes que poderão gerar insights valiosos para a empresa.

Portanto, um modelo de dados bem estruturado possibilita o armazenamento e a análise de dados mais clara e precisa, evitando informações duplicadas, conflitantes e irrelevantes para a empresa.

As etapas da modelagem de dados

A modelagem de dados segue algumas etapas para chegar de fato em um sistema de banco de dados coerente com as necessidades da empresa. 

O processo tem quatro etapas, são elas: 

  • Análise de requisitos;
  • Modelagem conceitual;
  • Modelagem lógica;
  • Modelagem física.

Veja mais detalhes sobre cada uma delas a seguir.

Análise de requisitos

A etapa de análise de requisitos é imprescindível para definir as regras de negócio do projeto. Isto é, o que o cliente busca com a criação do sistema (software, plataforma, aplicativo, etc.).  Essa etapa é fundamental para entender as necessidades do cliente e os requisitos do projeto, e especificá-los, analisá-los e validá-los antes de partir para a criação do modelo de banco de dados.

Assim, é importante esclarecer com o cliente todas as informações que você precisa para prosseguir com a criação de modelo de dados.

Modelagem conceitual

A fase de modelagem conceitual de dados visa capturar os requisitos apresentados pelos stakeholders na fase precedente e organizá-los com uma visão de negócios. 

O diagrama criado a partir da modelagem conceitual, deve conter todas as regras de negócio estabelecidas na etapa de análise de requisitos. Ou seja, as funcionalidades desse sistema. Essa etapa geralmente é feita com o cliente e contém alguns elementos essenciais para o funcionamento do sistema. 

O diagrama de modelagem conceitual precisa ter quatro elementos, são eles:

  • Entidades;
  • Relacionamento;
  • Cardinalidade;
  • Atributos. 

Esses elementos vão estabelecer o que o sistema de banco de dados vai conter (entidades), como elas se relacionam dentro desse sistema, qual o tipo/qualidade do relacionamento entre elas (cardinalidade) e os atributos (características) dessas entidades. Esse diagrama visual ajudará a trazer a visão de negócio do projeto e servirá como base para as próximas etapas de modelagem de um sistema de banco de dados.

Modelagem lógica de dados (MLDs)

A modelagem lógica de dados utiliza-se da estrutura do modelo conceitual e agrega outras informações que garantem a lógica do sistema sendo desenvolvido.

Nessa etapa, utiliza-se elementos como entidades, relacionamentos e atributos, além da adição de chaves. As chaves são divididas entre primárias e estrangeiras. As chaves primárias (PK), são responsáveis por garantir que os dados adicionados sejam únicos e exclusivos dentro do sistema. 

Esse elemento dentro de um banco de dados não pode se repetir e nem contar como nulo. Isso garante que as informações sejam fidedignas e evita a inserção de dados duplicados.

Já as chaves estrangeiras (FK), são chaves associativas. A função delas é estabelecer relações entre as entidades de um sistema. Assim, é possível identificar como esses elementos se relacionam dentro do banco de dados.

Por exemplo, considere as entidades “identificação do cliente” e “identificação do produto”. Na modelagem desse sistema, cada cliente terá uma chave primária que o identifica como elemento único nesse banco de dados. Nesse cenário, na entidade “identificação do produto”, você pode encontrar a chave estrangeira (FK), que representa determinado cliente da entidade “identificação do cliente” na entidade “identificação do produto”.

Essas definições são importantes para manter a lógica e funcionalidade do modelo de dados sendo desenvolvido. 

Modelagem física de dados (MFDs)

A modelagem física de dados é a etapa mais técnica desse processo, onde o arquiteto de dados transformará o modelo lógico de dados em um modelo físico.

Em outras palavras, essa etapa envolve a criação do banco de dados em si, respeitando as regras de negócios definidas nas etapas anteriores e seguindo os requisitos dos outros modelos criados previamente.

Um modelo físico de dados precisa ser lido por um SGBD (Sistema de Gerenciamento de Banco de Dados). Para tornar isso possível, utiliza-se uma linguagem de desenvolvimento (como por exemplo, SQL) que vai criar a estrutura necessária para a leitura do modelo de dados pelo SGBD.

Quais são os tipos de modelagem de dados?

Existem dois tipos de modelagem de dados: modelagem relacional e modelagem dimensional.

Essas técnicas de modelagem servem para fins diferentes. Confira as principais características desses tipos de modelagem de dados:

Modelagem relacional

Em um sistema de modelagem relacional, a principal característica é a capacidade de estabelecer uma relação entre as entidades do banco de dados. 

Esse modelo é feito a partir de tabelas que contém entidades e campos de atributos diversos. Por exemplo, entidade cliente e entidade pedidos. A ideia é que o modelo projetado possa estabelecer a relação entre essas entidades.

No exemplo citado, a entidade cliente, poderia se relacionar com a entidade pedidos, através da relação “um cliente pode fazer pedidos” ou “pedidos podem ser feitos por um cliente”.

Utiliza-se o modelo relacional para armazenar dados em sistemas transacionais da organização, ou seja, aqueles usados no dia a dia de um negócio e que sofrem mudanças, como inserções, alterações, e remoções de dados. 

Assim, o principal objetivo da modelagem relacional é armazenar as informações transacionais do negócio no banco de dados e torná-las acessíveis nessas atividades operacionais. 

Esse tipo de modelagem geralmente utiliza SGBDs relacionais, que são adequados para sistemas transacionais como mencionado acima.  

Modelagem dimensional

Já a modelagem dimensional é mais utilizada para processos de Data Warehouse (DW) e Business Intelligence (BI). Sendo assim, o objetivo principal desse modelo é simplificar a análise de dados multidimensionais. 

O modelo dimensional utiliza uma tabela fato, que contém informações de medidas, por exemplo, a quantidade de vendas, e tabelas de dimensão, onde estão as entidades, como por exemplo, clientes, data, categoria, produto, etc., que se relacionam com a tabela fato.

Utiliza-se esse modelo mais frequentemente para a extração, agregação e análise de dados. Com ele, é possível gerar relatórios, dashboards e insights a partir desses bancos de dados, que ajudarão na tomada de decisão estratégica de um negócio.

Assim, esse tipo de modelagem de banco de dados está mais relacionada com áreas como a de BI, que faz a coleta e análise de dados para ajudar no planejamento estratégico da empresa.

Conclusão

A modelagem de dados é uma etapa fundamental na criação de um sistema de banco de dados. Com esse processo é possível criar a estrutura do banco de dados da empresa ou do projeto para alcançar os objetivos do negócio com o armazenamento de dados.

Por isso, o modelo de dados deve ser bem projetado para não gerar duplicidade de informações, armazenar dados em excesso e causar conflito de dados nas análises. 

Esse processo é a base de estratégias de Business Intelligence e análises de dados no geral. Sendo assim, é indispensável nas empresas que planejam suas estratégias baseadas em dados reais e relevantes. Por isso, se você considera desenvolver um produto, criar uma empresa ou realizar um projeto que precise coletar dados, a modelagem de dados é um passo essencial para fazer isso de forma correta para o seu negócio.

Leia também: