Articles

Tutorial de Mineração de dados: o Que é | Processo | Técnicas & Exemplos

o Que é Mineração de Dados?

a mineração de dados é um processo de encontrar padrões potencialmente úteis a partir de enormes conjuntos de dados. É uma habilidade multidisciplinar que usa a aprendizagem de máquinas, estatísticas e ia para extrair informações para avaliar a probabilidade de eventos futuros. Os insights derivados da mineração de dados são usados para marketing, detecção de fraude, descoberta científica, etc.

a extracção de dados tem a ver com a descoberta de relações ocultas, insuspeitas e até então desconhecidas e válidas entre os dados. A mineração de dados também é chamada de descoberta de conhecimento em dados (KDD), extração de Conhecimento, análise de dados/padrões, coleta de Informações, etc.

neste tutorial de mineração de dados, você irá aprender os fundamentos da mineração de dados como-

  • O que é a mineração de dados? tipos de dados: processo de implementação da mineração de dados:
  • compreensão das empresas:
  • compreensão dos dados:
  • :
  • preparação de Dados:
  • transformação de Dados:
  • Modelação:
  • Técnicas de Mineração de Dados
  • Desafios da Implementação de mineração de Dados:
  • de Mineração de Dados Exemplos:
  • Ferramentas de Mineração de Dados
  • Benefícios de Mineração de Dados:
  • Desvantagens de Mineração de Dados
  • Aplicativos de Mineração de Dados

Tipos de Dados

de mineração de Dados pode ser realizada nas seguintes tipos de dados

  • bancos de dados Relacionais
  • armazéns de Dados
  • Avançadas de banco de dados e repositórios de informação
  • orientado a objetos e objeto-relacional de bases de dados
  • Transacionais e bancos de dados Espaciais
  • Heterogêneo e o legado de bases de dados
  • Multimídia e streaming de banco de dados
  • Texto bancos de dados
  • Text mining e Web mining

Dados Mineração de Implementação Processo

Mineração de Dados o Processo de Implementação
Mineração de Dados o Processo de Implementação

Vamos estudar a Mineração de Dados o processo de implementação em detalhes

o entendimento do Negócio:

nesta fase, de negócios e de mineração de dados, as metas são estabelecidas.

  • Em primeiro lugar, você precisa entender os objetivos do negócio e do cliente. Você precisa definir o que seu cliente quer (que muitas vezes até mesmo eles não se conhecem a si mesmos)
  • faça um balanço do cenário atual de mineração de dados. Factor em recursos, hipóteses, restrições e outros factores significativos na sua avaliação.usando objetivos de negócios e cenário atual, defina suas metas de mineração de dados.um bom plano de mineração de dados é muito detalhado e deve ser desenvolvido para alcançar os objetivos de mineração de dados e Negócios.compreensão dos dados:

    nesta fase, a verificação da sanidade dos dados é realizada para verificar se é apropriado para os objetivos de mineração de dados.

    • Em primeiro lugar, os dados são recolhidos a partir de várias fontes de dados disponíveis na organização. estas fontes de dados podem incluir múltiplas bases de dados, Ficheiros planos ou cubos de dados. Há questões como a correspondência de objetos e integração de esquemas que podem surgir durante o processo de integração de dados. É um processo bastante complexo e complicado como dados de várias fontes improváveis de corresponder facilmente. Por exemplo, a tabela a contém uma entidade chamada cust_no, enquanto outra tabela B contém uma entidade chamada cust-id.
    • portanto, é bastante difícil garantir que ambos os objetos se referem ao mesmo valor ou não. Aqui, os metadados devem ser usados para reduzir erros no processo de integração de dados. em seguida, o passo é procurar por propriedades dos dados adquiridos. Uma boa maneira de explorar os dados é responder às questões de mineração de dados (decididas na fase de negócios) usando a consulta, relatórios e ferramentas de visualização. com base nos resultados da consulta, a qualidade dos dados deve ser determinada. Dados em falta, se for caso disso, devem ser adquiridos.

    preparação de dados:

    nesta fase, a produção de dados está pronta. o processo de preparação de dados consome cerca de 90% do tempo do projeto. os dados de diferentes fontes devem ser selecionados, limpos, transformados, formatados, anônimos e construídos (se necessário).

    Limpeza de dados é um processo para” limpar ” os dados através da suavização de dados ruidosos e preenchimento de valores em falta. por exemplo, para um perfil demográfico do cliente, faltam dados relativos à idade. Os dados estão incompletos e devem ser preenchidos. Em alguns casos, pode haver dados anómalos. Por exemplo, a idade tem um valor de 300. Os dados podem ser inconsistentes. Por exemplo, o nome do cliente é diferente em tabelas diferentes. as operações de transformação de dados alteram os dados para torná-los úteis na mineração de dados. A seguinte transformação pode ser aplicada

    transformação de dados:

    operações de transformação de dados contribuiriam para o sucesso do processo de mineração. suavização: Ajuda a remover o ruído dos dados. agregação: as operações de resumo ou agregação são aplicadas aos dados. Ou seja, os dados de vendas semanais são agregados para calcular o total mensal e anual.

    generalização: nesta etapa, os dados de baixo nível são substituídos por conceitos de alto nível com a ajuda de hierarquias de conceitos. Por exemplo, a cidade é substituída pelo condado.

    normalização: normalização realizada quando os dados dos atributos são dimensionados para cima e para baixo. Exemplo: os dados devem cair no intervalo -2.0 a 2.0 pós-normalização.

    construção dos atributos: estes atributos são construídos e incluem o conjunto dado de atributos úteis para a mineração de dados.

    O resultado deste processo é um conjunto de dados final que pode ser usado na modelagem. nesta fase, modelos matemáticos são usados para determinar padrões de dados. com base nos objetivos de negócio, devem ser selecionadas técnicas de modelagem adequadas para o conjunto de dados preparado.

  • crie um cenário para testar a qualidade e validade do modelo.
  • execute o modelo no conjunto de dados preparado.os resultados devem ser avaliados por todas as partes interessadas para garantir que o modelo possa cumprir os objetivos de mineração de dados.

avaliação:

nesta fase, os padrões identificados são avaliados em função dos objectivos empresariais. os resultados gerados pelo modelo de mineração de dados devem ser avaliados em função dos objetivos da empresa.ganhar compreensão empresarial é um processo iterativo. Na verdade, embora entendendo, novos requisitos de negócios podem ser levantados por causa da mineração de dados.

  • a go or no-go decision is taken to move the model in the deployment phase.
  • implantação:

    na fase de implantação, você envia suas descobertas de mineração de dados para operações comerciais diárias. os conhecimentos ou informações descobertos durante o processo de mineração de dados devem ser facilmente compreensíveis para as partes interessadas não técnicas. um plano detalhado de implantação, para o transporte, manutenção e monitoramento de descobertas de mineração de dados é criado.um relatório final do projeto é criado com lições aprendidas e experiências-chave durante o projeto. Isto ajuda a melhorar a Política de negócios da organização.

    Técnicas de Mineração de Dados

    Técnicas de Mineração de Dados
    Técnicas de Mineração de Dados

    1.Classificação:

    Esta análise é utilizada para obter informações importantes e relevantes sobre dados e metadados. Este método de mineração de dados ajuda a classificar os dados em diferentes classes.

    2. Clustering:

    Clustering analysis is a data mining technique to identify data that are like each other. Este processo ajuda a entender as diferenças e semelhanças entre os dados.

    3. Regressão:

    Análise de regressão é o método de mineração de dados de identificação e análise da relação entre variáveis. É usado para identificar a probabilidade de uma variável específica, dada a presença de outras variáveis.

    4. Regras de associação:

    Esta técnica de mineração de dados ajuda a encontrar a associação entre dois ou mais itens. Descobre um padrão escondido no conjunto de dados.

    5. Detecção exterior:

    Este tipo de técnica de mineração de dados refere-se à observação de itens de dados no conjunto de dados que não correspondem a um padrão esperado ou comportamento esperado. Esta técnica pode ser usada em uma variedade de domínios, tais como intrusão, detecção, fraude ou detecção de falhas, etc. A detecção externa também é chamada de análise Outlier ou mineração Outlier.

    6. Padrões sequenciais:

    Esta técnica de extracção de dados ajuda a descobrir ou identificar padrões ou tendências semelhantes nos dados de transacções durante determinado período.

    7. Previsao:

    Prediction has used a combination of the other techniques of data mining like trends, sequential patterns, clustering, classification, etc. Ele analisa eventos passados ou instâncias em uma seqüência direita para prever um evento futuro. são necessários peritos qualificados para formular as perguntas sobre a extracção de dados.devido ao pequeno tamanho da base de dados de treinamento, um modelo pode não se encaixar em estados futuros. a extracção de Dados necessita de grandes bases de dados que, por vezes, são difíceis de gerir.as práticas comerciais podem ter de ser alteradas para determinar a utilização da informação descoberta.se o conjunto de dados não for diverso, os resultados da extracção de dados podem não ser exactos. informação de integração necessária a partir de bases de dados heterogéneas e sistemas de informação globais pode ser complexa

    exemplos de mineração de dados:

    agora neste curso de mineração de dados, vamos aprender sobre a mineração de dados com exemplos:

    exemplo 1: considere um chefe de marketing do serviço de telecomunicações que quer aumentar as receitas dos serviços de longa distância. Para o alto ROI em seus esforços de vendas e marketing de perfis de clientes é importante. Ele tem um vasto conjunto de dados de informações do cliente como Idade, Sexo, Renda, histórico de crédito, etc. Mas é impossível determinar as características das pessoas que preferem chamadas de longa distância com análise manual. Usando técnicas de mineração de dados, ele pode descobrir padrões entre usuários de chamadas de alta distância e suas características. por exemplo, ele pode aprender que seus melhores clientes são mulheres casadas entre os 45 e os 54 anos que ganham mais de 80 mil dólares por ano. Os esforços de Marketing podem ser direccionados para esse tipo de demografia. Exemplo 2:

    um banco quer procurar novas formas de aumentar as receitas das suas operações com cartões de crédito. Eles querem verificar se o uso duplicaria se as taxas fossem reduzidas para metade.

    Banco tem vários anos de registro em saldos médios de cartões de crédito, quantias de pagamento, uso de limite de crédito, e outros parâmetros-chave. Eles criam um modelo para verificar o impacto da nova Política de negócios proposta. Os resultados dos dados mostram que cortar taxas ao meio para uma base de clientes alvo poderia aumentar as receitas em US $10 milhões.

    Ferramentas de Mineração de Dados

    a Seguir são 2 populares Ferramentas de Mineração de Dados amplamente utilizados na Indústria

    I-idioma:

    R linguagem é uma ferramenta de código aberto para computação estatística e gráficos. R tem uma grande variedade de testes estatísticos clássicos, análise de séries cronológicas, classificação e técnicas gráficas. Ele oferece instalações de entrega e armazenamento de dados eficazes.

    earn more here

    Oracle Data Mining:

    Oracle Data Mining popularly knowns as ODM is a module of the Oracle Advanced Analytics Database. Esta ferramenta de mineração de dados permite aos analistas de dados gerar insights detalhados e fazer previsões. Ajuda a prever o comportamento do cliente, desenvolve perfis de clientes, identifica oportunidades de venda cruzada.

    Saiba mais aqui

    benefícios da mineração de dados:

    • a técnica de mineração de dados ajuda as empresas a obter informações baseadas no conhecimento. a mineração de dados ajuda as organizações a fazer os ajustes rentáveis em operação e produção. a extracção de dados é uma solução eficaz em termos de custos e eficiente em comparação com outras aplicações de dados estatísticos. a mineração de dados ajuda no processo de tomada de decisão.
    • facilita a previsão automatizada de tendências e comportamentos, bem como a descoberta automatizada de padrões ocultos.
    • Pode ser implementado em novos sistemas, bem como plataformas existentes
    • É o processo rápido que torna fácil para os usuários analisar uma enorme quantidade de dados em menos tempo.

    desvantagens da extracção de dados

    • Existem possibilidades de as empresas venderem informações úteis dos seus clientes a outras empresas por Dinheiro. Por exemplo, a American Express vendeu as compras de cartão de crédito de seus clientes para as outras empresas.
    • muitos software de análise de dados de mineração é difícil de operar e requer treinamento prévio para trabalhar. diferentes ferramentas de mineração de dados funcionam de diferentes maneiras devido a diferentes algoritmos empregados em seu projeto. Portanto, a seleção da ferramenta correta de mineração de dados é uma tarefa muito difícil. as técnicas de mineração de dados não são precisas, e por isso pode causar graves consequências em certas condições.

    Aplicativos de Mineração de Dados

    -commerce sites de E-commerce usam mineração de dados para oferecer vendas cruzadas e up-sells através de seus sites. Um dos nomes mais famosos é a Amazon, que usa técnicas de mineração de dados para obter mais clientes em sua loja de comércio eletrônico. a mineração de dados permite que as regras de desenvolvimento do supermercado predizem se os seus compradores estavam à espera. Ao avaliar o seu padrão de compra, eles poderiam encontrar Mulheres clientes que estão mais provavelmente grávidas. Podem começar a atacar produtos como pó de bebé, loja de bebés, fraldas e assim por diante. Investigação Criminal Investigação Criminal Investigação Criminal Investigação Criminal ajuda as agências de investigação criminal a implantar mão-de-obra policial (onde é que um crime mais provável de acontecer e quando?), que procuram numa passagem de fronteira, etc.

    Aplicações de Uso
    Comunicações técnicas de mineração de Dados são utilizados no setor de comunicação, para prever o comportamento do cliente para oferecer altamente segmentados e relevantes campanhas. a mineração de dados ajuda as companhias de seguros a preçarem os seus produtos de forma rentável e a promoverem novas ofertas aos seus clientes novos ou existentes.
    Educação a mineração de dados beneficia os educadores a aceder aos dados dos estudantes, a prever os níveis de realização e a encontrar estudantes ou grupos de estudantes que necessitem de atenção adicional. Por exemplo, estudantes que são fracos em matemática.
    fabrico com a ajuda dos fabricantes de mineração de dados pode prever o desgaste dos activos de produção. Eles podem antecipar a manutenção que os ajuda a reduzi-los para minimizar o tempo de inatividade. a extracção de dados ajuda o sector financeiro a ter uma visão dos riscos de mercado e a gerir a conformidade regulamentar. Ajuda os bancos a identificar os prováveis faltosos a decidir se emitem cartões de crédito, empréstimos, etc. técnicas de mineração de dados ajudam centros comerciais e mercearias a identificar e organizar itens mais vendáveis nas posições mais atenciosas. Ele ajuda os proprietários de lojas a chegar com a oferta que incentiva os clientes a aumentar seus gastos. os prestadores de serviços, como as indústrias de telefonia móvel e de serviços públicos, utilizam a extracção de dados para prever as razões pelas quais um cliente deixa a sua empresa. Eles analisam detalhes de faturamento, interações de atendimento ao cliente, reclamações feitas à empresa para atribuir a cada cliente uma pontuação de probabilidade e oferece incentivos.
    E-Commerce
    Bioinformática a mineração de dados ajuda a extrair dados biológicos de conjuntos maciços de dados recolhidos em biologia e medicina.

    resumo:

    • Data Mining definition: Data Mining is all about explaining the past and predicting the future via Data analysis.a mineração de dados ajuda a extrair informações de enormes conjuntos de dados. É o procedimento de mineração de conhecimento a partir de dados.o processo de mineração de dados inclui compreensão de negócios, compreensão de dados, preparação de Dados, Modelagem, evolução, implantação.técnicas importantes de mineração de dados são a classificação, agrupamento, Regressão, regras de associação, detecção externa, padrões sequenciais e predição da linguagem R e Mineração de Dados Oracle são ferramentas e técnicas proeminentes de mineração de dados.a técnica de mineração de dados ajuda as empresas a obter informações baseadas no conhecimento.
    • A principal desvantagem da mineração de dados é que muitos software de análise é difícil de operar e requer treinamento prévio para trabalhar. a mineração de dados é usada em diversas indústrias, tais como comunicações, seguros, educação, fabricação, bancos, varejo, prestadores de serviços, comércio eletrônico, Supermercados Bioinformática.

    Deixe uma resposta

    O seu endereço de email não será publicado. Campos obrigatórios marcados com *