Saltar para o conteúdo

Lei de Benford: diferenças entre revisões

Origem: Wikipédia, a enciclopédia livre.
Conteúdo apagado Conteúdo adicionado
Etiquetas: Edição via dispositivo móvel Edição feita através do sítio móvel
adição de história e exemplos de aplicação
Etiquetas: Possível conteúdo ofensivo Editor Visual
Linha 28: Linha 28:
Um conjunto de números satisfaz a lei de Benford<ref name=Nigrini1996>{{citar periódico|último =Nigrini |primeiro =M. |ano=1996 |título=A taxpayer compliance application of Benford's Law |periódico=J Amer Tax Assoc |volume=18 |páginas=72–91}}</ref> se o primeiro dígito &nbsp;''d'' (''d''&nbsp;∈&nbsp;{1,&nbsp;...,&nbsp;9}) ocorre com a seguinte [[probabilidade]]:<ref name=Durtschi2004>{{citar periódico|último1 = Durtschi |primeiro1 = C |último2 = Hillison |primeiro2 = W |último3 = Pacini |primeiro3 = C |ano= 2004 |título= The effective use of Benford's Law to assist in detecting fraud in accounting data | url = |periódico= J Forensic Accounting | volume = 5 |número= |páginas= 17–34 }}</ref><ref name=Raimi1976>{{citar periódico|último1 = Raimi |primeiro1 = RA |ano= 1976 |título= The first digit problem | url = |periódico= [[American Mathematical Monthly]] | volume = 83 |número= |páginas= 521–538 | doi=10.2307/2319349}}</ref>
Um conjunto de números satisfaz a lei de Benford<ref name=Nigrini1996>{{citar periódico|último =Nigrini |primeiro =M. |ano=1996 |título=A taxpayer compliance application of Benford's Law |periódico=J Amer Tax Assoc |volume=18 |páginas=72–91}}</ref> se o primeiro dígito &nbsp;''d'' (''d''&nbsp;∈&nbsp;{1,&nbsp;...,&nbsp;9}) ocorre com a seguinte [[probabilidade]]:<ref name=Durtschi2004>{{citar periódico|último1 = Durtschi |primeiro1 = C |último2 = Hillison |primeiro2 = W |último3 = Pacini |primeiro3 = C |ano= 2004 |título= The effective use of Benford's Law to assist in detecting fraud in accounting data | url = |periódico= J Forensic Accounting | volume = 5 |número= |páginas= 17–34 }}</ref><ref name=Raimi1976>{{citar periódico|último1 = Raimi |primeiro1 = RA |ano= 1976 |título= The first digit problem | url = |periódico= [[American Mathematical Monthly]] | volume = 83 |número= |páginas= 521–538 | doi=10.2307/2319349}}</ref>
: <math>P(d)=\log_{10}(d+1)-\log_{10}(d)=\log_{10} \left(\frac{d+1}{d}\right)=\log_{10} \left(1+\frac{1}{d}\right).</math>
: <math>P(d)=\log_{10}(d+1)-\log_{10}(d)=\log_{10} \left(\frac{d+1}{d}\right)=\log_{10} \left(1+\frac{1}{d}\right).</math>
:
{| class="wikitable"
|-
! {{nobold|{{mvar|d}}}} !! {{tmath|P(d)}} !! Probabilidade de ser o primeiro dígito{{tmath|}}
|-
| 1 || style="text-align:right;"| {{bartable|30.1|%|10}}
|-
| 2 || style="text-align:right;"| {{bartable|17.6|%|10}}
|-
| 3 || style="text-align:right;"| {{bartable|12.5|%|10}}
|-
| 4 || style="text-align:right;"| {{bartable| 9.7|%|10}}
|-
| 5 || style="text-align:right;"| {{bartable| 7.9|%|10}}
|-
| 6 || style="text-align:right;"| {{bartable| 6.7|%|10}}
|-
| 7 || style="text-align:right;"| {{bartable| 5.8|%|10}}
|-
| 8 || style="text-align:right;"| {{bartable| 5.1|%|10}}
|-
| 9 || style="text-align:right;"| {{bartable| 4.6|%|10}}
|}
== História ==
As primeiras observações a respeito deste fenômeno foram feitas pelo astrônomo [[Simon Newcomb]], por volta de 1881, ao notar  que as primeiras páginas de livros de logaritmo, utilizados na época para realizar cálculos logarítmicos, eram muito mais utilizadas do que as páginas anteriores<ref>{{Citar periódico|ultimo=Newcomb|primeiro=Simon|data=1881|titulo=Note on the Frequency of Use of the Different Digits in Natural Numbers|url=http://www.jstor.org/stable/2369148|jornal=American Journal of Mathematics|volume=4|numero=1|paginas=39–40|doi=10.2307/2369148}}</ref>. Isso o levou a propor que, em qualquer lista de números tirados de um conjunto aleatório, o conjunto de números que começam com ‘1’ tende a ser maior. Em seus estudos, Newcomb sugere que a probabilidade de um único número N ser o primeiro dígito de um número era igual a log(N+1) - log(N).

O fenômeno foi esquecido por um tempo até ser redescoberto pelo físico [[:en:Frank_Benford|Frank Benford]], por volta de 1938<ref>{{Citar periódico|ultimo=Benford|primeiro=Frank|data=1938|titulo=The Law of Anomalous Numbers|url=http://www.jstor.org/stable/984802|jornal=Proceedings of the American Philosophical Society|volume=78|numero=4|paginas=551–572}}</ref>. [[:en:Frank_Benford|Frank Benford]] coletou dezena de milhares de números de 20 domínios diferentes, dentre eles estavam áreas de superfície de 335 rios, tamanho de populações de 3259 locais dos EUA, 104 constantes físicas, 1800 pesos moleculares, 5000 entradas de um livro matemático, 308 números contidos em uma edição da Reader’s Digest, os 342 primeiros endereços listados na American Men of Science e 418 taxas de mortalidade. O total de números utilizados no ''paper'' chegou a 20.229   e todos seguiam a mesma distribuição. A descoberta deste padrão foi nomeada posteriormente de Benford.

Em 1995, o matemático [[Theodore Hill|Theodore P. Hill]] conseguiu provar o fenômeno por trás das distribuições.<ref>{{Citar periódico|ultimo=Hill|primeiro=Theodore P.|data=1995-11|titulo=A Statistical Derivation of the Significant-Digit Law|url=https://projecteuclid.org/euclid.ss/1177009869|jornal=Statistical Science|lingua=EN|volume=10|numero=4|paginas=354–363|doi=10.1214/ss/1177009869|issn=0883-4237}}</ref>

== Aplicações ==

=== Detecção de Fraude Contábil ===
Em 1972, [[Hal Varian]] sugeriu que a lei de Benford poderia ser utilizada para detectar possíveis fraudes em lista de dados socioeconômicos apresentados em apoio a decisões de planejamento público. Com base na suposição de que as pessoas que compõem os números tendem a distribuir seus dígitos razoavelmente uniformemente, uma comparação simples da distribuição de frequência de primeiro dígito dos dados com a distribuição esperada de acordo com a lei de Benford deve mostrar quaisquer resultados anômalos.

Seguindo isso, Mark Nigrini mostrou que a lei de Benford poderia ser usada em contabilidade e auditoria forense como um indicador de fraude. Na prática, as aplicações da lei de Benford para detecção de fraude usam mais do que o primeiro dígito.<ref>{{Citar periódico|data=1999-05-01|titulo=I've Got Your Number|url=http://www.journalofaccountancy.com/Issues/1999/May/nigrini|jornal=Journal of Accountancy}}</ref>

=== Prova Judicial ===
Nos EUA, evidências baseadas na Lei de Benford já foram admitidas em casos criminais nos níveis local, federal e estadual.<ref>{{citar web|url=http://www.wnyc.org/shows/radiolab/episodes/2009/10/09/segments/137643|titulo=From Benford to Erdös|data=30/09/2009|acessodata=|publicado=|ultimo=|primeiro=}}</ref>

=== Dados Eleitorais ===
A lei de Benford foi invocada como evidência de fraude nas eleições iranianas de 2009<ref>{{Citar periódico|titulo=Statistics hint at fraud in Iranian election|url=https://www.newscientist.com/article/mg20227144.000-statistics-hint-at-fraud-in-iranian-election.html|jornal=New Scientist|lingua=en-US}}</ref>, e também usadas para analisar outros resultados eleitorais. Entretanto, outros especialistas consideram a lei de Benford essencialmente inútil como um indicador estatístico de fraude eleitoral em geral.<ref>{{Citar web|url=https://web.archive.org/web/20140517120934/http://vote.caltech.edu/sites/default/files/benford_pdf_4b97cc5b5b.pdf|titulo=Wayback Machine|data=2014-05-17|acessodata=2018-06-26}}</ref><ref>{{citar web|url=https://doi.org/10.1063/1.166498|titulo=Do dynamical systems follow Benford’s law?|data=|acessodata=|publicado=|ultimo=|primeiro=}}</ref>

=== Dados Macroeconômicos ===
Os dados macroeconômicos relatados pelo governo grego à União Européia antes de entrar na zona do euro mostraram-se provavelmente fraudulentos usando a lei de Benford.<ref>{{Citar periódico|ultimo=Worstall|primeiro=Tim|titulo=Greece Was Lying About Its Budget Numbers|url=https://www.forbes.com/sites/timworstall/2011/09/12/greece-was-lying-about-its-budget-numbers/|jornal=Forbes|lingua=en}}</ref>

=== Análise de dígitos de preços ===
A importância deste índice de referência para a detecção de irregularidades nos preços foi demonstrada pela primeira vez num estudo à escala europeia que investigou os preços praticados antes e depois da introdução do euro .  A introdução do euro em 2002, com suas diversas taxas de câmbio, distorceu os padrões de preços nominais existentes e, ao mesmo tempo, manteve os preços reais. Enquanto os primeiros dígitos dos preços nominais distribuídos de acordo com a lei de Benford, o estudo mostrou um claro desvio deste índice para o segundo e terceiro dígitos em preços nominais de mercado com uma clara tendência para preços psicológicos após o choque nominal da introdução do euro.<ref>{{Citar periódico|ultimo=Sehity|primeiro=Tarek el|ultimo2=Hoelzl|primeiro2=Erik|ultimo3=Kirchler|primeiro3=Erich|data=2005-12|titulo=Price developments after a nominal shock: Benford's Law and psychological pricing after the euro introduction|url=https://doi.org/10.1016/j.ijresmar.2005.09.002|jornal=International Journal of Research in Marketing|volume=22|numero=4|paginas=471–480|doi=10.1016/j.ijresmar.2005.09.002|issn=0167-8116}}</ref>

=== Análise de dados do genoma ===
O número de quadros de leitura abertos e sua relação com o tamanho do genoma difere entre eucariontes e procariontes, sendo que o primeiro apresenta uma relação log-linear e o segundo, uma relação linear. A lei de Benford foi usada para testar essa observação com um excelente ajuste aos dados em ambos os casos.<ref>{{Citar periódico|ultimo=Friar|primeiro=James L.|ultimo2=Goldman|primeiro2=Terrance|ultimo3=Pérez–Mercader|primeiro3=Juan|data=2012-05-18|titulo=Genome Sizes and the Benford Distribution|url=http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0036624|jornal=PLOS ONE|lingua=en|volume=7|numero=5|paginas=e36624|doi=10.1371/journal.pone.0036624|issn=1932-6203|pmc=PMC3356352|pmid=22629319}}</ref>

=== Detecção de fraude científica ===
Um teste de coeficientes de regressão em artigos publicados mostrou concordância com a lei de Benford. Um grupo de controle fabricou estimativas estatísticas e os resultados fabricados não obedeceram a lei de Benford.<ref>{{citar periódico|ultimo=Diekmann|primeiro=Andreas|data=16/05/2007|titulo=Not the First Digit! Using Benford's Law to Detect Fraudulent Scientif ic Data
Andreas Diekmann|url=https://doi.org/10.1080/02664760601004940|jornal=Journal of Applied Statistics|acessodata=}}</ref>


{{referências|col=2}}
{{referências|col=2}}

Revisão das 01h21min de 26 de junho de 2018

A distribuição dos primeiros dígitos (de 1 a 9)[1] de acordo com a lei de Benford.[2] Cada barra azul representa um dígito e sua altura, a porcentagem da probabilidade de ocorrê-la em algum caso real.[3]

A lei de Benford, também chamada de lei do primeiro dígito,[4][5] refere-se à distribuição de dígitos em várias fontes de casos reais.[6] Sem homogeneidade, esta distribuição mostra que o dígito 1 tem 30% de chance de aparecer em um conjunto de dados estatísticos enquanto valores maiores tem menos possibilidade de aparecer.[7]

Foi o astrônomo americano Simon Newcomb.Em torno de 1881, o primeiro a descobrir. Nomeada e definida por Frank Benford em 1938,[8] essa demonstração pode ser aplicada estatisticamente em contas de energia elétrica, ações de empresas, população, taxa de mortalidade, comprimentos de rios e constantes matemáticas e físicas.[9] Todas essas afirmações são calculadas ou definidas junto a uma escala logarítmica.[10]

Definição matemática

Um conjunto de números satisfaz a lei de Benford[11] se o primeiro dígito  d (d ∈ {1, ..., 9}) ocorre com a seguinte probabilidade:[12][13]

d Probabilidade de ser o primeiro dígito
1 30.1% 30.1
 
2 17.6% 17.6
 
3 12.5% 12.5
 
4 9.7% 9.7
 
5 7.9% 7.9
 
6 6.7% 6.7
 
7 5.8% 5.8
 
8 5.1% 5.1
 
9 4.6% 4.6
 

História

As primeiras observações a respeito deste fenômeno foram feitas pelo astrônomo Simon Newcomb, por volta de 1881, ao notar  que as primeiras páginas de livros de logaritmo, utilizados na época para realizar cálculos logarítmicos, eram muito mais utilizadas do que as páginas anteriores[14]. Isso o levou a propor que, em qualquer lista de números tirados de um conjunto aleatório, o conjunto de números que começam com ‘1’ tende a ser maior. Em seus estudos, Newcomb sugere que a probabilidade de um único número N ser o primeiro dígito de um número era igual a log(N+1) - log(N).

O fenômeno foi esquecido por um tempo até ser redescoberto pelo físico Frank Benford, por volta de 1938[15]. Frank Benford coletou dezena de milhares de números de 20 domínios diferentes, dentre eles estavam áreas de superfície de 335 rios, tamanho de populações de 3259 locais dos EUA, 104 constantes físicas, 1800 pesos moleculares, 5000 entradas de um livro matemático, 308 números contidos em uma edição da Reader’s Digest, os 342 primeiros endereços listados na American Men of Science e 418 taxas de mortalidade. O total de números utilizados no paper chegou a 20.229   e todos seguiam a mesma distribuição. A descoberta deste padrão foi nomeada posteriormente de Benford.

Em 1995, o matemático Theodore P. Hill conseguiu provar o fenômeno por trás das distribuições.[16]

Aplicações

Detecção de Fraude Contábil

Em 1972, Hal Varian sugeriu que a lei de Benford poderia ser utilizada para detectar possíveis fraudes em lista de dados socioeconômicos apresentados em apoio a decisões de planejamento público. Com base na suposição de que as pessoas que compõem os números tendem a distribuir seus dígitos razoavelmente uniformemente, uma comparação simples da distribuição de frequência de primeiro dígito dos dados com a distribuição esperada de acordo com a lei de Benford deve mostrar quaisquer resultados anômalos.

Seguindo isso, Mark Nigrini mostrou que a lei de Benford poderia ser usada em contabilidade e auditoria forense como um indicador de fraude. Na prática, as aplicações da lei de Benford para detecção de fraude usam mais do que o primeiro dígito.[17]

Prova Judicial

Nos EUA, evidências baseadas na Lei de Benford já foram admitidas em casos criminais nos níveis local, federal e estadual.[18]

Dados Eleitorais

A lei de Benford foi invocada como evidência de fraude nas eleições iranianas de 2009[19], e também usadas para analisar outros resultados eleitorais. Entretanto, outros especialistas consideram a lei de Benford essencialmente inútil como um indicador estatístico de fraude eleitoral em geral.[20][21]

Dados Macroeconômicos

Os dados macroeconômicos relatados pelo governo grego à União Européia antes de entrar na zona do euro mostraram-se provavelmente fraudulentos usando a lei de Benford.[22]

Análise de dígitos de preços

A importância deste índice de referência para a detecção de irregularidades nos preços foi demonstrada pela primeira vez num estudo à escala europeia que investigou os preços praticados antes e depois da introdução do euro .  A introdução do euro em 2002, com suas diversas taxas de câmbio, distorceu os padrões de preços nominais existentes e, ao mesmo tempo, manteve os preços reais. Enquanto os primeiros dígitos dos preços nominais distribuídos de acordo com a lei de Benford, o estudo mostrou um claro desvio deste índice para o segundo e terceiro dígitos em preços nominais de mercado com uma clara tendência para preços psicológicos após o choque nominal da introdução do euro.[23]

Análise de dados do genoma

O número de quadros de leitura abertos e sua relação com o tamanho do genoma difere entre eucariontes e procariontes, sendo que o primeiro apresenta uma relação log-linear e o segundo, uma relação linear. A lei de Benford foi usada para testar essa observação com um excelente ajuste aos dados em ambos os casos.[24]

Detecção de fraude científica

Um teste de coeficientes de regressão em artigos publicados mostrou concordância com a lei de Benford. Um grupo de controle fabricou estimativas estatísticas e os resultados fabricados não obedeceram a lei de Benford.[25]

Referências

  1. Raimi, Ralph A. (1976). «The First Digit Problem». American Mathematical Monthly. 83 (7): 521–538. doi:10.2307/2319349 
  2. Arno Berger and Theodore P Hill, Benford's Law Strikes Back: No Simple Explanation in Sight for Mathematical Gem, 2011
  3. Élise Janvresse and Thierry de la Rue (2004), "From Uniform Distributions to Benford's Law", Journal of Applied Probability, 41 1203–1210 doi:10.1239/jap/1101840566 Recorde militar preprint
  4. L. C. Washington, "Benford's Law for Fibonacci and Lucas Numbers", The Fibonacci Quarterly, 19.2, (1981), 175–177
  5. Duncan, R. L. (1967). «An Application of Uniform Distribution to the Fibonacci Numbers». The Fibonacci Quarterly. 5: 137–140 
  6. Theodore P. Hill, "The Significant-Digit Phenomenon", The American Mathematical Monthly, Vol. 102, No. 4, (Apr., 1995), pp. 322–327. Official web link (subscription required). Alternate, free web link[ligação inativa].
  7. Formann AK (2010) The Newcomb-Benford Law in its relation to some common distributions. PLoS 5(5): e10541. doi:10.1371/journal.pone.0010541
  8. Frank Benford (março de 1938). «The law of anomalous numbers». Proceedings of the American Philosophical Society. 78 (4): 551–572. JSTOR 984802 
  9. Suh, I. S.; Headrick, T. C.; Minaburo, S. (2011). «An effective and efficient analytic technique: A bootstrap regression procedure and Benford's Law». J Forensic & Investigative Accounting. 3 (3) 
  10. Simon Newcomb (1881). «Note on the frequency of use of the different digits in natural numbers». American Journal of Mathematics, Vol. 4, No. 1. American Journal of Mathematics. 4 (1/4): 39–40. JSTOR 2369148. doi:10.2307/2369148 
  11. Nigrini, M. (1996). «A taxpayer compliance application of Benford's Law». J Amer Tax Assoc. 18: 72–91 
  12. Durtschi, C; Hillison, W; Pacini, C (2004). «The effective use of Benford's Law to assist in detecting fraud in accounting data». J Forensic Accounting. 5: 17–34 
  13. Raimi, RA (1976). «The first digit problem». American Mathematical Monthly. 83: 521–538. doi:10.2307/2319349 
  14. Newcomb, Simon (1881). «Note on the Frequency of Use of the Different Digits in Natural Numbers». American Journal of Mathematics. 4 (1): 39–40. doi:10.2307/2369148 
  15. Benford, Frank (1938). «The Law of Anomalous Numbers». Proceedings of the American Philosophical Society. 78 (4): 551–572 
  16. Hill, Theodore P. (novembro de 1995). «A Statistical Derivation of the Significant-Digit Law». Statistical Science (em inglês). 10 (4): 354–363. ISSN 0883-4237. doi:10.1214/ss/1177009869 
  17. «I've Got Your Number». Journal of Accountancy. 1 de maio de 1999 
  18. «From Benford to Erdös». 30 de setembro de 2009 
  19. «Statistics hint at fraud in Iranian election». New Scientist (em inglês) 
  20. «Wayback Machine» (PDF). 17 de maio de 2014. Consultado em 26 de junho de 2018 
  21. «Do dynamical systems follow Benford's law?» 
  22. Worstall, Tim. «Greece Was Lying About Its Budget Numbers». Forbes (em inglês) 
  23. Sehity, Tarek el; Hoelzl, Erik; Kirchler, Erich (dezembro de 2005). «Price developments after a nominal shock: Benford's Law and psychological pricing after the euro introduction». International Journal of Research in Marketing. 22 (4): 471–480. ISSN 0167-8116. doi:10.1016/j.ijresmar.2005.09.002 
  24. Friar, James L.; Goldman, Terrance; Pérez–Mercader, Juan (18 de maio de 2012). «Genome Sizes and the Benford Distribution». PLOS ONE (em inglês). 7 (5): e36624. ISSN 1932-6203. PMC PMC3356352Acessível livremente Verifique |pmc= (ajuda). PMID 22629319. doi:10.1371/journal.pone.0036624 
  25. Diekmann, Andreas (16 de maio de 2007). «Not the First Digit! Using Benford's Law to Detect Fraudulent Scientif ic Data Andreas Diekmann». Journal of Applied Statistics  line feed character character in |titulo= at position 79 (ajuda)