Anteriormente, eram consideradas hipóteses cujas leis foram transferidas para a divisão da população em geral. Agora vamos verificar as hipóteses sobre a transferência da lei para uma divisão desconhecida, para que possamos verificar a hipótese nula sobre aquelas de que a população geral está dividida em alguma lei conhecida. O uso de critérios estatísticos para testar tais hipóteses é denominado critérios por enquanto.
Critério agoraé chamado de critério para testar a hipótese sobre a transferência da lei para uma espécie desconhecida. Existe um mundo significativo de diferenças entre as divisões empíricas e teóricas.
A tarefa principal. Uma divisão empírica (seleção) é dada. Crie uma suposição (coloque uma hipótese) sobre o tipo de divisão teórica e verifique a hipótese desenhada em um determinado nível de significância α.
O conceito da tarefa principal consiste em duas partes:
1. Hipótese.
2. Verificação da hipótese em determinado nível de significância.
Vamos dar uma olhada no relatório e suas partes.
1. Escolha da hipótese Para o tipo de divisão teórica, pode-se trabalhar manualmente com o auxílio de polígonos e histogramas de frequência. Alinhe o polígono empírico (ou histograma) com as leis de divisão conhecidas e selecione a mais adequada.
Vamos traçar as leis mais importantes da divisão:
A aplicação das leis empíricas à divisão é mostrada nas figuras:
O tempo (a) tem uma hipótese sobre uma distribuição normal, o tempo (b) tem uma hipótese sobre uma distribuição igual e o tempo (c) tem uma hipótese sobre uma distribuição de Poisson.
As hipóteses sobre a divisão teórica podem basear-se na mudança teórica na natureza da mudança nos signos. Por exemplo, o estudo das mentes do teorema de Lyapunov permite-nos desenvolver uma hipótese sobre uma divisão normal. A consistência da média e da dispersão sugere a hipótese de uma distribuição de Poisson.
Na verdade, na maioria das vezes temos que interagir com uma divisão normal, em nossas pesquisas é necessário verificar a hipótese sobre a distribuição.
Invertendo a hipótese sobre a distribuição teórica da oferta: é possível levar em conta as diferenças entre as distribuições teóricas e empíricas transmitidas das não-rede, o que explica a variabilidade de entrar na amostra destas e de outras 'ectivas, ou então é diferente falar sobre a diferença geral entre as divisões. Existem diferentes métodos de verificação (critérios para cada um) - c 2 (qui-quadrado), Kolmogorov, Romanovsky e in.
Critério de Pearson.
O principal critério de Pearson é a sua universalidade: com a sua ajuda, hipóteses sobre diferentes leis de divisão podem ser verificadas.
1. Reverificação da hipótese sobre a divisão de género. Por favor, pare de escolher terminar o excelente serviço P com um grande número de opções diferentes. Para facilitar o processamento, dividiremos o intervalo da opção de menor para o maior valor em é de partes iguais e é importante que o valor gasto no intervalo skin seja aproximadamente igual ao número que especifica o meio do intervalo. Tendo considerado o número de opções que foram incluídas no intervalo, uma seleção agrupada é assim chamada:
opções……….. X 1 X 2 … x-s
frequências…………. P 1 P 2 … ns ,
de XI– valores dos meios dos intervalos, e e eu- O número de opções que foram gastas em eu-i intervalo (frequências empíricas). Usando os dados removidos, você pode calcular a média amostral e o valor quadrático da média amostral σ B. Podemos verificar a suposição de que a população geral está dividida de acordo com a lei normal e os parâmetros M(X) = , D(X) = . Então você pode saber muitos números selecionando-os P, que pode ocorrer nos intervalos da pele quando aplicado (estas são frequências teóricas). Para qual tabela mostra o valor da função de Laplace, encontramos o grau de absorção em eu-eu intervalo:
,
de e euі eu- Entre eu o intervalo. Multiplicando a derivação dos dados amostrais, encontramos as frequências teóricas: n eu = n · pi Nosso objetivo é equacionar as frequências empíricas e teóricas, que, claro, se dividem entre um tipo e outro, e entender quais características são inerentes à rede, para não simplesmente fazer hipóteses sobre a distribuição normal do rastreamento do mesma magnitude, e o fedor é tão grande que esta hipótese é apoiada. Com que finalidade é utilizado o critério para o aparecimento de queda de valor?
. (7)
O sentido é óbvio: somam-se partes, que são os quadrados das frequências empíricas das teóricas para somar frequências teóricas semelhantes. Pode-se argumentar que, independentemente da lei real de divisão da população em geral, a lei da divisão do valor faseado (7) quando aplicada à lei da divisão com o número de graus de liberdade k = s - 1 – R, de R- O número de parâmetros da secção transferida, estimados com base nos dados de amostragem. Uma divisão normal é caracterizada por dois parâmetros, portanto k = s - 3. Para o critério selecionado, a área crítica do lado direito será, conforme indicado pela mente
(8)
de α - Reverberação de significado. Bem, a área crítica é determinada pela desigualdade e o escopo de aceitação da hipótese é .
Bem, para verificar a hipótese nula N 0: a população geral está distribuída normalmente - é necessário calcular o critério de valor selecionado:
, (7`)
e na tabela de pontos críticos da subdivisão 2, encontre o ponto crítico, vikorista com base nos valores de α e k = s - 3. Quando a hipótese nula é aceita, ela é mal compreendida.
bunda. Os resultados do rastreamento do produto são apresentados na tabela:
Crie uma hipótese sobre o tipo de subdivisão e verifique-a com igual significância a=0,01.
I. Hipóteses de Vysunennaya.
Para indicar o tipo de divisão empírica, utilizaremos um histograma
120 160 180 200 220 280
Observando os histogramas, você pode fazer uma suposição sobre a lei normal da divisão dos sinais que aparecem na totalidade geral.
II. Verifiquemos novamente a hipótese sobre a distribuição normal, com base no critério de Pearson.
1. Calculável, s B. Alternativamente, tome a média aritmética dos finais dos intervalos:
2. Conhecemos os intervalos (Z i ; Z i+1): ; .
A extremidade esquerda do primeiro intervalo é considerada (-¥) e a extremidade direita do intervalo restante é (+¥). Os resultados são apresentados na tabela. 4.
3. Conhecemos as frequências teóricas Pi e as frequências teóricas (div. Tabela 4).
Tabela 4
eu | Cordão de intervalos | F(Zi) | Ф(Z eu+1) | P i = Ф(Z i+1)-Ф(Z i) | ||||
XI | x eu+1 | Z eu | Z eu+1 | |||||
-¥ | -1,14 | -0,5 | -0,3729 | 0,1271 | 6,36 | |||
-1,14 | -0,52 | -0,3729 | -0,1985 | 0,1744 | 8,72 | |||
-0,52 | 0,11 | -0,1985 | 0,0438 | 0,2423 | 12,12 | |||
0,11 | 0,73 | 0,0438 | 0,2673 | 0,2235 | 11,18 | |||
0,73 | +¥ | 0,2673 | 0,5 | 0,2327 | 11,64 |
4. As frequências empíricas e teóricas são iguais. Para quem:
a) é quantificável segundo o critério de Pearson, o que deve ser evitado.
Os cálculos são apresentados na Tabela 5.
Tabela 5
eu | |||||
6,36 | -1,36 | 1,8496 | 0,291 | ||
8,72 | 1,28 | 1,6384 | 0,188 | ||
12,12 | 1,88 | 3,5344 | 0,292 | ||
11,18 | 0,82 | 0,6724 | 0,060 | ||
11,64 | -2,64 | 6,9696 | 0,599 | ||
S |
b) de acordo com a tabela de pontos críticos de divisão c 2 com um determinado nível de significância a = 0,01 e o número de passos de liberdade k = m-3 = 5-3 = 2, encontra-se o ponto crítico; mãe .
Comparar c. . Porém, não há razão para formular uma hipótese sobre a lei normal da divisão dos signos da população geral que está se formando. Tobto. A diferença entre frequências empíricas e teóricas é insignificante (ligeiramente). ◄
Respeito. Intervalos para acomodar inúmeras frequências empíricas (n i<5), следует объединить, а частоты этих интервалов сложить. Если производилось объединение интервалов, то при определении числа степеней свободы по формуле K=m-3 следует в качестве m принять число оставшихся после объединения интервалов.
2. Testando novamente a hipótese sobre uma distribuição uniforme. Com a utilização do critério de Pearson para testar a hipótese de uma distribuição igualitária da população com homogeneidade de homogeneidade
É necessário, calculados os valores após a seleção óbvia, estimar os parâmetros Aі b para as fórmulas:
de A*і b*- classificações Aі b. Eficaz, para distribuição igualitária M(X) = , Os sinais podem ser removidos do sistema para identificação A*і b*: , Tais soluções incluem expressões (9).
Então, deixando-o ir, , você pode conhecer as frequências teóricas usando as fórmulas
Aqui é- O número de intervalos durante os quais a amostra foi dividida.
Os valores do critério de Pearson, que devem ser levados em consideração, são calculados pela fórmula (7`), e mais criticamente, pela tabela que indica o número de graus de liberdade k = s - 3. Depois disso, os limites entre as linhas críticas são determinados da mesma forma que para verificar a hipótese sobre a divisão normal.
3. Reverificação da hipótese sobre a divisão da exibição. Neste caso, tendo dividido a seleção óbvia em intervalos iguais, olharemos para a sequência de opções igualmente distantes umas das outras (é importante que todas as opções que foram perdidas em eu- o intervalo, que aceita valores que se aproximam do seu meio), e frequências semelhantes e eu(o número da opção de seleção que foi gasta em eu- o intervalo). Calculável a partir desses dados e tomado como uma estimativa do parâmetro λ tamanho. Em seguida, as frequências teóricas são calculadas usando a fórmula
A seguir compararemos a importância do critério de Pearson com a determinação do número de graus de liberdade k = s - 2.
bunda. Para uma amostra, a série estatística de intervalo é semelhante a esta:
verifique se há igual importância α = 0,05 hipótese o.
Atribuído ao critério. Critérios para atribuição de duas divisões: a). empírico e teórico, por exemplo, igual e normal; b). uma divisão empírica com outra divisão empírica.
Sujeito a critério. O critério é que a amostra seja suficientemente grande, ≥50.
Hipóteses:
: a diferença entre as duas divisões é insignificante.
: a diferença entre as duas divisões é significativa.
Algoritmo de suporte - critério.
Vamos criar uma tabela para maior clareza das divisões:
1. Na primeira coluna estão os sinais de significado empírico, ordenados por crescimento.
2. Outra coluna possui frequências empíricas para o valor skin, e na terceira coluna estão frequências empíricas para o valor skin, calculadas pela fórmula: f* mp j = f mp j / n, onde f mp j é a frequência empírica da outra coluna , n - Obsyag vibіrki.
3. Podemos “acumular” frequências empíricas usando a seguinte fórmula:
∑ f * emp j = ∑ f * emp j -1 + f * emp j ,
de ∑ f* emp j -1 – frequência, acumulada nos valores frontais dos sinais;
j – número de série do símbolo; f * emp j - frequência empírica da descarga j dada. Os resultados são colocados no século IV.
4. A 5ª seção pode ter acumulado frequências teóricas que se alinham com a distribuição teórica conhecida; Se 2 divisões empíricas estiverem alinhadas, o empilhador 5 distribuirá as frequências empíricas acumuladas para a seleção 2.
5. Determine as diferenças entre as frequências acumuladas e coloque seus valores absolutos no 6º estágio. Significativamente їх dj.
6. Calcule o valor máximo dj → dmax usando 6 etapas.
7. Siga a fórmula:
,
onde n 1 é o sujeito da seleção 1, n 2 é o sujeito da seleção 2, pois = = n, então .
8. Para um determinado nível de significância na Tabela VII, encontre adicionalmente o ponto limite λ cr.
9. Yakscho λ emp< λ кр, то различия между распределениями признака незначимы; если λ эмп >λ cr, então a diferença entre as divisões é significativa.
bunda. A loja de alimentos realizou um teste de controle do cowbass vendido. Seleção da amostra n = 100. Extraia os dados mostrados na tabela.
azar, Sr. | |||||||||
frequência |
Utilizando o critério adicional λ – Kolmogorov-Smirnov, a significância de α = 0,05 é igual, o que garante dados amostrais com distribuição igual por seção.
Decisão.: a diferença entre as divisões empíricas e teóricas transferidas é insignificante.
: a diferença entre a distribuição empírica e a distribuição teórica transferida é significativa.
A função de um valor de variável subdividido, dividido igualmente em uma seção, é semelhante a esta:
Lembre-se da tabela:
x-j | f emp j | f emp j /n | ∑ f* emp j | ∑ f* teoria j | dj |
0,10 | 0,10 | 0,1 | |||
0,11 | 0,21 | 0,2 | 0,01 | ||
0,08 | 0,29 | 0,3 | 0,01 | ||
0,09 | 0,38 | 0,4 | 0,02 | ||
0,12 | 0,50 | 0,5 | |||
0,10 | 0,60 | 0,6 | |||
0,13 | 0,73 | 0,7 | 0,03 | ||
0,15 | 0,88 | 0,8 | 0,08 | ||
0,12 | 1,00 | 0,9 | 0,1 |
Vamos explicar como a tabela é preenchida. O significado dos dois primeiros pontos é tirado da mente. O número da outra briga é dividido por n = 100 e o resultado é registrado na 3ª coluna. O próximo número da 4ª coluna é igual à soma do número desta linha da 3ª coluna e o número da frente da 4ª coluna. Cada número do 1º passo é representado pela fórmula f*theor = xj/10 e o resultado é escrito no 5º passo. 6 fogões – módulo de varejo 4 e 5 fogões. A maior parte no século 6 d max = 0,1; λemp =0,1 = 1.
Ao nível de significância α = 0,05, da tabela VI também encontramos o ponto limite λ cr = 1,358. Lascas λ emp< λ кр (1 < 1,358), то принимаем гипотезу на уровне значимости α = 0,05. Данные выборки согласуются с равномерным распределением на отрезке .
Atribuído ao critério
Critérios de atribuição para equalização de duas divisões:
a) empírico com teórico, por exemplo, igual e normal;
b) uma divisão empírica com outra divisão empírica.
O critério permite encontrar o ponto em que a quantidade de diferenças acumuladas entre duas divisões é maior e avaliar a confiabilidade dessa diferença.
Descrição do critério
Nossos métodos colocaram as frequências das duas divisões próximas à primeira categoria, depois a soma da primeira e das outras categorias, depois a soma da primeira, segunda e terceira categorias, e assim por diante. Desta forma, fica claro que a frequência acumulou até este nível.
Se houver uma diferença entre duas partes da frequência, então a qualquer momento a diferença nas frequências acumuladas atinge um valor crítico, e podemos reconhecer as diferenças como estatisticamente confiáveis. Antes de formular o critério, esta diferença é incluída. Quanto maior for a significância empírica, maior será a significância.
Hipóteses
As diferenças entre as divisões não são confiáveis (a julgar pelo ponto máximo de diferenças acumuladas entre elas).
: As diferenças entre as divisões são confiáveis (a julgar pelo ponto de diferenças máximas acumuladas entre elas).
Para satisfazer o critério Kolmogorov-Smirnov, é necessário atingir as seguintes mentes:
1. A medição pode ser realizada utilizando uma escala de intervalos e valores.
2. As vibrações podem ser espontâneas ou independentes.
3. É importante que o total de duas amostras seja ≥ 50. Com o aumento da amostragem, a precisão do critério aumenta.
4. Os dados empíricos devem permitir a possibilidade de ordenar aumentos ou alterações de qualquer sinal e devem representar claramente qualquer alteração unidirecional. Neste caso, por ser importante respeitar o princípio da ordenação dos sinais, é preferível utilizar o critério XI-quadrado.
Este critério é utilizado com o propósito de atingir os mais altos padrões, qual é o critério XI-quadrado. Caso contrário, parece que com esta ajuda é possível distinguir entre a divisão empírica e a teórica, ou duas divisões empíricas uma após a outra. No entanto, quando congelado XI-O quadrado é definido pelas frequências das duas divisões, então neste critério as frequências acumuladas (cumulativas) da secreção cutânea (alternativas) serão iguais. Se a diferença nas frequências acumuladas nas duas divisões for grande, então a diferença entre as duas divisões é a mesma.
Data 8.12. Suponhamos que em um experimento um psicólogo precise utilizar um dado de seis faces com números nas laterais de 1 a 6. Para a pureza do experimento é necessário recortar então o cubo “ideal”. de modo que, quando você lança uma grande quantidade de arremessos, a borda da pele cai aproximadamente o mesmo número de vezes. O mistério está na esperança de que este cubo fique próximo do ideal?
Decisão. Lançamos o cubo 120 vezes e equalizamos a divisão entre a divisão empírica e a teórica. Como a distribuição teórica é igual, então as frequências teóricas correspondentes chegam a 20. A distribuição das frequências empíricas e teóricas pode ser apresentada separadamente na Tabela 8.15:
Para seguir o critério Kolmogorov-Smirnov, é necessário realizar uma transformação baixa a partir dos dados da Tabela 8.15. As transformações são apresentadas na Tabela 8.16 e suas explicações são explicadas:
Símbolo F.E. A Tabela 8.16 indicará as frequências teóricas acumuladas. A tabela tem a seguinte ordem: até a primeira frequência teórica 20, acrescenta-se outra frequência, também superior a 20, sai o número 20 + 20 = 40. O número 40 é colocado no lugar da outra frequência. Em seguida, a frequência teórica é adicionada a 40, o valor 60 é removido - colocado no lugar da terceira frequência teórica e assim por diante.
Símbolo Facebook A Tabela 8.16 apresenta as frequências empíricas acumuladas. Para tanto, é necessário expandir as frequências empíricas em incrementos: 15, 18, 18, 21, 23, 25 e depois em ordem de frequência. Então, desde o início a primeira frequência é igual a 15, depois outra frequência é adicionada a ela, e a soma 15 + 18 = 33 é retirada e colocada no lugar da outra frequência, então 18 é adicionado a 33 (33 + 18 = 51), o número 51 é retirado e colocado no lugar das terceiras frequências etc.
Símbolo |FE- Facebook | A Tabela 8.16 mostra os valores absolutos da diferença entre a frequência teórica e empírica na área da pele.
O valor empírico deste critério, que é designado como D Vazio para derivar a fórmula Vikorist (8.13):
Para її, retirando o meio dos números | FE-FB | encontre o número máximo (em nossa seleção é semelhante a 9) e subdivida-o no procedimento de seleção P. Para nossa vipadka P= 120, que
Para este critério, uma tabela com valores críticos é fornecida no Adendo 1 nº 13. Da Tabela 13 aparece o Adendo 1, porém, no caso em que o número de elementos de seleção é superior a 100, então os valores críticos são calculado usando a fórmula (8.14).
Descrição do critério
O critério clássico de Kolmogorov (ou talvez Kolmogorov-Smirnov) é usado para testar hipóteses simples sobre a relevância da amostra analisada para uma determinada lei de distribuição.
Vá em frente - selecione valores de variáveis independentes, mas subdivididos - uma função empírica para a divisão - uma função de "referência" para a divisão com parâmetros conhecidos. As estatísticas baseadas no critério são expressas da seguinte forma:
É significativo pela hipótese de que a amostra é ordenada por divisão. Seguindo o teorema de Kolmogorov, se a hipótese for válida, verifica-se:
0:%20%5Cquad%20%5Clim_%7Bn%20%5Cto%20%5Cinfty%7DP(%5Csqrt%7Bn%7D%20D_n%20%5Cleq%20t)=K(t)=%5Csum_%7Bj=- %5Cinfty%7D%5E%7B+%5Cinfty%7D(-1)%5Ej%20%5Cmathrm%7Be%7D%5E%7B-2j%5E2t%5E2%7D." alt="\forall t >0: \quad \lim_(n \to \infty)P(\sqrt(n) D_n \leq t)=K(t)=\sum_(j=-\infty)^(+\infty)(-1 )^j \mathrm(e)^(-2j^2t^2).">!} !}A hipótese é rejeitada quando as estatísticas ultrapassam o quantil da divisão de um determinado nível de significância e são aceitas em outro caso.
Observação: Pelo critério de Kolmogorov, as estatísticas com a correção de Bilshov podem ser completamente analisadas: . A divisão das estatísticas, se a hipótese for válida, o que se verifica, convergirá rapidamente para a divisão de Kolmogorov em 25%20" alt=" n>25"> зависимостью от объема выборки можно пренебречь.!}!}
Critério utilizado para verificação de normalidade
Nesse caso, o critério de Kolmogorov é utilizado para verificar a hipótese sobre a confiabilidade da amostra, que está sujeita à lei normal, cujos parâmetros são estimados para a própria amostra pelo método da máxima verossimilhança. Para ser verificado novamente hipótese complicada E como estimativas dos parâmetros da lei normal, são determinadas estimativas amostrais da média e da dispersão.
Neste caso (Lilliefors) foram selecionadas estatísticas modificadas:
.Valores críticos para estatísticas mostrados na tabela (Lilliefors):
0,15 | 0,10 | 0,05 | 0,03 | 0,01 | |
0,775 | 0,819 | 0,895 | 0,955 | 1,035 |
Testando novamente hipóteses complexas
Ao revisar hipóteses complexas, se a seleção for avaliada pelos parâmetros da lei com que o ano é verificado, os critérios não paramétricos do bem perdem o poder da liberdade na divisão (Kac, Kiefer, Wolfowitz). Ao revisar hipóteses complexas, a distribuição inteligente de estatísticas de critérios não paramétricos (e do critério de Kolmogorov) reside em uma série de fatores: de acordo com a lei, que é cuidadosa, que confirma uma hipótese justa, que é verificada existe; dependendo do tipo de parâmetro que está sendo avaliado e do número de parâmetros a serem avaliados; em certos casos dependendo do valor específico do parâmetro (por exemplo, em várias famílias das subdivisões gama beta); método de estimativa de parâmetros.
As diferenças nas áreas fronteiriças das mesmas estatísticas ao reinterpretar hipóteses simples e complexas baseiam-se na teoria de que é impossível ignorá-las sempre.
Sobre a aplicação do critério de Kolmogorov para testar várias hipóteses dobráveis de milagres. no site da Universidade Técnica Estadual de Novosibirsk:
- Análise estatística de dados, modelagem e investigação de padrões internacionais. Abordagem computacional: monografia. - Novosibirsk: Editora NDTU, 2011. - 888 p. (Capítulos 3 e 4)
- Modelos de estatísticas de subdivisão de testes não paramétricos são usados para testar hipóteses complexas contra várias estimativas de máxima verossimilhança. Parte I // Tecnologia Vimiryuvalna. 2009. Nº 6. - P.3-11.
- Modelos de estatísticas de subdivisão de testes não paramétricos são usados para testar hipóteses complexas contra várias estimativas de máxima verossimilhança. Parte II // Tecnologia Vimiryuvalna. 2009. Nº 8. - P.17-26.
Literatura
- Kolmogoroff A.N. Na determinação empírica de uma lei de distribuição // Giornale dell Istituto Italiano degly Attuari. 1933. -Vol. 4. - Nº 1. - P. 83-91.
- Bilshov L.M., Smirnov N.V. Tabelas de estatística matemática. M: Nauka, 1983.
- Lilliefors H.W. No teste Kolmogorov-Smirnov para normalidade com média e variância desconhecidas // J. Am. Estatista. Associado, 1967. V.62. - P.399-402.
- Kac M., Kiefer J., Wolfowitz J. Em testes de normalidade e outros testes de adequação com base em métodos de distância // Ann. Matemática. Estado, 1955. V.26. - P.189-211.
- Recomendações para padronização. Estatística aplicada Regras para verificação dos resultados dos teóricos. Parte II. Critérios não paramétricos. - M.: Tipo de padrões. 2002. - 64 p.
O critério Kolmogorov-Smirnov é um critério não paramétrico, geralmente utilizado para testar hipóteses simples sobre a relevância da amostra analisada para uma determinada lei de distribuição. É mais óbvio que este critério é utilizado para verificar os agregados estudados normalidade do gênero.
1. História do desenvolvimento do critério Kolmogorov-Smirnov
O critério Kolmogorov-Smirnov foi analisado pelos matemáticos Radyansky Andrii Mikolayovich Kolmogorovі Mikola Vasilovich Smirnov.
Kolmogorov A.M. (1903-1987) - Herói da Pracia Socialista, professor da Universidade Estadual de Moscou, acadêmico da Academia de Ciências da URSS - o maior matemático do século 20 e um dos fundadores da teoria econômica moderna.
Smirnov N.V. (1900-1966) - Membro correspondente da Academia de Ciências da URSS, um dos criadores dos métodos não paramétricos de estatística matemática e da teoria das divisões de limites das estatísticas de ordem.
Mais tarde, o critério Kolmogorov-Smirnov foi examinado posteriormente usando o método de estagnação para verificar a normalidade dos agregados pelo estatístico americano, professor da Universidade George Washington H'ubert Lilliefors(Hubert Whitman Lilliefors, 1928-2008). O professor Lilliefors foi um dos pioneiros da tecnologia computacional na pesquisa estatística.
Hubert Lilliefors2. Será utilizado o critério Kolmogorov-Smirnov?
Este critério permite avaliar a consistência das diferenças entre as divisões de duas amostras, incluindo a possibilidade de estimar a similaridade da divisão perante a amostra de acordo com a lei da distribuição normal Ilu.
3. Em que casos pode ser utilizado o critério Kolmogorov-Smirnov?
O critério Kolmogorov-Smirnov para verificação de coletas de dados existentes em escala kolkisny.
Para maior confiabilidade dos dados obtidos, a análise das amostras pode ser mantida grande: n ≥ 50. Com o tamanho da população estimada de 25 a 50 elementos, a correção de Belshov é completamente estável.
4. Como desenvolver o critério Kolmogorov-Smirnov?
O critério Kolmogorov-Smirnov é validado com a ajuda de programas estatísticos especiais. É baseado em estatísticas como:
de e aí S - o limite superior do multiplicador S é exato, Fn - função da subdivisão da totalidade, F(x) - função de uma subseção normal
Os valores de confiabilidade derivados baseiam-se na suposição de que é a variação média e padrão da divisão normal a priori e não é estimada a partir dos dados.
Porém, na prática, os parâmetros são calculados diretamente a partir dos dados. Para este tipo, o critério de normalidade inclui vou fazer uma hipótese("quão difícil é calcular as estatísticas destes dados ou a maior importância que está por trás dos dados médios e padrão calculados a partir dos dados"), e é induzida pela justiça de Lilliefors (Lilliefors, 1967).
5. Como interpretar o significado do critério Kolmogorov-Smirnov?
Se a estatística Kolmogorov-Smirnov D for significativa, então a hipótese de que a divisão correspondente é normal pode ser rejeitada.