Problema dos tanques alemães
Na Teoria da estimativa, o problema de estimar o máximo de uma distribuição uniforme discreta de uma amostragem sem reposição é conhecido como Problema dos tanques alemães, por causa de sua aplicação na Segunda Guerra Mundial para a estimativa do múnero de tanques alemães.
A análise ilustra a diferença entre Inferência frequentista e Inferência bayesiana.
Estimar o máximo da população baseado em uma única amostra leva a resultados divergentes, enquanto a estimativa baseada em múltiplas amostras é uma questão prática e instrutiva de estimativa cuja resposta é simples, mas não óbvia.
Índice |
Exemplo [editar]
Suponha que um oficial tenha avistado k=4 tanques com números de série 2, 6, 7, 14, então o máximo número de série observado é m=14. O número total de tanques desconhecido é chamado N.
A fórmula frequentista para a estimativa do total de tanques é
.
A estimativaBayesiana é
.
Naturalmente, ainda sabemos que há no mínimo 14 tanques. As fórmulas para a média e desvio padrão são
.
A função massa de probabilidade é
Esta distribuição tem obliquidade positiva.
Problema histórico [editar]
Em tempos de guerra, um objetivo chave da inteligência militar é determinar o poder de força do inimigo: na Segunda Guerra Mundial, os Aliados queriam estimar o número de tanques que os alemães tinham, e abordaram isto de duas formas principais: métodos tradicionais de inteligência e estimativa estatística. A abordagem estatística mostrou-se muito mais precisa do que os métodos tradicionais de inteligência; a referência primária para a abordagem estatística é Ruggles & Brodie (1947).1
Dados específicos [editar]
De acordo com as estimativas convencionais da inteligência dos Aliados, os alemães estavam produzindo em torno de 1400 tanques por mês entre junho de 1940 e setembro de 1942. Aplicando a fórmula aos números de série de tanques alemães capturados, o número foi calculado como sendo 256 por mês. Após a guerra, registros alemães capturados mostraram que o número real era de 255.2
Estimativas para alguns meses específicos são dadas pela tabela abaixo:3 4
| Mês | Estimativa estatística | Estimativa tradicional | Registros alemães |
| Junho/1940 | 169 | 1000 | 122 |
| Junho/1941 | 244 | 1550 | 271 |
| Agosto/1942 | 327 | 1550 | 342 |
Pouco após o Dia D, seguindo os rumores de larga produção de tanques Panther obtidos pela inteligência convencional, análises das rodas de dois tanques (consistindo de 48 rodas cada, ou seja, 96 rodas no total) levaram a uma estimativa de Panthers produzidos em fevereiro de 1944, substancialmente mais do que tinha sido originalmente previsto; registros alemães após a guerra mostraram que a produção para aquele mês tinha sido de 276.5 Especificamente, a análise das rodas produziu uma estimativa do número de moldes de rodas; a discussão com os fabricantes de rodas britânicos estimou então o número de rodas que podem ser produzidos a partir destes muitos moldes.
References [editar]
- ↑ Ruggles; Brodie, Henry (March 1947), "An empirical approach to economic intelligence in WWII", Journal of the American Statistical Association (American Statistical Association) 42 (237): 72–91, doi:
- ↑ Gavyn Davies. How a statistical formula won the war The Guardian, 20 July 2006
- ↑ Ruggles & Brodie, p. 89
- ↑ Order Statistics, in Virtual Laboratories in Probability and Statistics
- ↑ Ruggles & Brodie, pp. 82–83
.
.
.
