Regras de associação
Origem: Wikipédia, a enciclopédia livre.
Em mineração de dados e aprendizado de tratamento, regras de associação são usadas para descobrir elementos que ocorrem em comum dentro de um determinado conjunto de dados.[1]
Índice |
[editar] Algoritmos
Existem diversos algoritmos que realizam buscas de regras de associação em bases de dados. Abaixo seguem alguns exemplos:
[editar] Definição
| transação | leite | pão | manteiga | cerveja |
|---|---|---|---|---|
| 1 | 1 | 1 | 0 | 0 |
| 2 | 0 | 1 | 1 | 0 |
| 3 | 0 | 0 | 0 | 1 |
| 4 | 1 | 1 | 1 | 0 |
| 5 | 0 | 1 | 0 | 0 |
[editar] Conceitos Úteis
Várias métricas podem ser utilizadas para avaliar as regras e identificar quais são interessantes. As restrições mais utilizadas são limiares mínimos de suporte e confiança.
- O suporte sup(X) de um conjunto X é definido como a proporção de transações da base de dados que contém esse conjunto.
- A confiança de uma regra é definida
. Por exemplo, a regra
tem uma confiança de 0.2 / 0.4 = 0.5 na base de dados, o que significa que para 50% das transações que contém leite e pao a regra está correta.
- A confiança pode ser interpretada como uma estimativa de probabilidade P(Y | X), a probabilidade de encontrar o RHS da regra nas transações sobre a condição que essas transações também contenham LHS.[2]
- O lift de uma regra é definido como
ou a razão do suporte observado que são esperados se X e Y estão independente. A regra
possui um lift de
. - A convicção (conviction) de uma regra é definido como
. A regra
tem uma convicção de
, e pode ser interpretado como a razão da freqüência esperada que X ocorre sem Y (isto quer dizer, a frequencia que a regra faz uma predição incorreta) se X e Y forem divididos pela freqüência das predições incorretas. neste exemplo, a convicção de 1.2 mostra que a regra
seria incorreta com uma frequencia de 20% (1.2 mais freqüente) se a ssociação entre X e Y tivesse uma chance aleatória.
. Por exemplo, a regra
tem uma confiança de
ou a razão do suporte observado que são esperados se X e Y estão
.
. A regra
, e pode ser interpretado como a razão da freqüência esperada que X ocorre sem Y (isto quer dizer, a frequencia que a regra faz uma predição incorreta) se X e Y forem divididos pela freqüência das predições incorretas. neste exemplo, a convicção de 1.2 mostra que a regra