O que é Data Mining?

Saiba mais sobre o que é Data mining, o processo usado por empresas para identificar relações em grandes coleções de dados (Big Data)

Ronaldo Gogoni
• Atualizado há 1 ano e 8 meses

O Data Mining é o processo de vasculhar grandes quantidades de dados atrás de relações que podem ser transformadas em informações, úteis para empresas e órgãos dos mais diversos. Exatamente por isso, ele é considerado uma evolução digital da Estatística e, como tal, pode trazer muito dinheiro a todos os envolvidos.

Data Mining / o que é data mining

O que é Data Mining?

Data Mining, que em português é chamado de mineração ou prospecção de dados, é o processo de explorar uma grande coleção de dados em busca de padrões consistentes, ou relações entre uma certa quantidade de dados. Uma vez identificadas as relações, elas precisam ser validadas de acordo com os parâmetros das buscas.

O objetivo principal do Data Mining é criar novos conjuntos de dados, de modo a identificar novas tendências, comportamentos de massa, buscas massivas em um determinado período e assuntos relacionados a elas visualizados pelos consumidores e etc. Em Tecnologia da Informação, o Data Mining é essencial do ponto de vista de negócios, embora exija um grande conjunto de ferramentas dedicadas para a apropriada identificação dos dados desejados.

O Big Data é uma coleção de dados não estruturados, que contém todo o tipo de informação que você imaginar. Em TI, a função do Data Mining é varrer as coleções de Big Data em busca de uma relação específica, identificar todas as relações buscadas, separar esses dados e transformá-los em informação (dados estruturados) que podem ser usados em aplicações das mais diversas, como produtos e serviços.

Warner / Batman: O Cavaleiro das Trevas / o que é data mining
Créditos: Warner

Hoje, ferramentas de data mining são essenciais para empresas que buscam fornecer melhores produtos e serviços, pois elas são capazes de vasculhar um determinado perfil de usuário e verificar o que ele consome, fala e escuta na internet. Tendo esses dados em mãos, fica simples adequar suas estratégias de mercado.

O grande problema é que o Big Data é realmente BIG. Estamos soterrados em exabytes de dados dos mais diversos, com a maioria sendo ruído, que não renderá informações pertinentes. O recurso é usado para vasculhar redes sociais, sites, fóruns e apps atrás de acontecimentos, assuntos do dia, comportamentos, produtos que fazem sucesso  e etc, mas separar o joio do trigo não é fácil.

Não por coincidência que data mining é fortemente calcado em modelos estatísticos, uma ciência que nasceu da necessidade de coletar dados, estudá-los e aprender com eles, de modo a desenvolver modelos úteis. A função do data mining é a mesma, mas com tudo o que falamos, consumimos e ouvimos na internet, algo que pode render muito dinheiro.

Relacionados

Escrito por

Ronaldo Gogoni

Ronaldo Gogoni

Ex-autor

Ronaldo Gogoni é formado em Análise de Desenvolvimento de Sistemas e Tecnologia da Informação pela Fatec (Faculdade de Tecnologia de São Paulo). No Tecnoblog, fez parte do TB Responde, explicando conceitos de hardware, facilitando o uso de aplicativos e ensinando truques em jogos eletrônicos. Atento ao mundo científico, escreve artigos focados em ciência e tecnologia para o Meio Bit desde 2013.