Sunteți pe pagina 1din 10

AVALIAO DO PODER E TAXAS DE ERRO TIPO I DO TESTE DE SCOTT-KNOTT POR MEIO DO MTODO DE MONTE CARLO1

ELOISE CURY DA SILVA2 DANIEL FURTADO FERREIRA3 EDUARDO BEARZOTI3


RESUMO - O Teste de Scott-Knott um mtodo de agrupamento usado como alternativa em que procedimentos de comparaes mltiplas so recomendados, com a caracterstica de no apresentar ambigidade nos resultados. Como pouco se sabe sobre seu poder e taxas de erro tipo I, este trabalho tem por objetivo responder a essas questes. O mtodo de Monte Carlo foi utilizado para simular experimentos utilizando a linguagem Pascal, gerando-se amplas situaes experimentais com relao preciso, nmero de tratamentos, nmero de repeties e nvel de significncia adotado. A utilizao do teste de ScottKnott recomendada, por possuir poder elevado, taxas de erro tipo I quase sempre de acordo com os nveis nominais e por apresentar resultados com ausncia de ambigidade.

TERMOS PARA INDEXAO: Teste de Scott-Knott, taxas de erro por experimento e por comparao, poder, simulao.

EVALUATION OF POWER AND TYPE I ERROR RATES OF THE SCOTT-KNOTTS TEST BY THE METHOD OF MONTE CARLO*
ABSTRACT - Scott and Knotts test is a clustering method used as an alternative where multiple comparison procedures are applied, with the characteristic of not presenting ambiguity in the results. As little is known about its power and type I error rates, this work aimed at answering these questions. The Monte Carlo method was used to simulate experiments using the Pascal language, generating large experimental situations in relationship of precision, the number of treatments, the number of replications and the level of significance adopted. Due the fact of possessing high power, the type I error rate, almost always was in accordance with the nominal levels and for presenting results with absence of ambiguity, use of Scott and Knotts test was advised.

INDEX TERMS: Scott and Knott's test, comparisonwise, experimentwise, power, simulation. INTRODUO Um grande nmero de procedimentos de comparaes mltiplas tem surgido durante as ltimas dcadas para comparar mdias de tratamentos, quando o teste F da anlise da varincia significativo. Embora de fcil aplicao e implementados na maioria dos programas estatsticos, os pesquisadores encontram muita dificuldade de trabalhar com a ambigidade dos resultados obtidos por esses mtodos. Alm dessa dificuldade, esto sujeitos a erros, e os principais deles so os erros tipo I e II. O erro tipo II definido por Mood, Graybill e Boes (1974) como sendo o erro que se comete ao aceitar a hiptese nula (falsa), quando, na verdade, esta deveria ser rejeitada (). J o poder de um teste definido como sendo a probabilidade de rejeitar a hiptese nula Ho, quando ela falsa (1-). H muitas dificuldades em se comparar o erro tipo I nos procedimentos de comparaes mltiplas (Carmer e Swanson, 1971), sendo que alguns tipos de medidas podem ser encontradas na literatura. A razo entre o nmero de erros tipo I (concluindo que i j quando i = j) e o nmero de comparaes definida como taxa de erro por comparao, chamada de comparisonwise e, a razo entre o nmero de experimentos com um ou mais erros tipo I (concluindo que i j quando i = j) e o nmero total de experimentos definido como taxa de erro por experimento, chamada de experimentwise (Steel e Torrie, 1980).

1. Parte da Dissertao de Mestrado apresentada UNIVERSIDADE FEDERAL DE LAVRAS (UFLA), para obteno do grau de Mestre. 2. Estatstica, MSc. em Agronomia, rea de concentrao Estatstica e Experimentao Agropecuria. 3. Prof. Dr. do Departamento de Cincias Exatas, UFLA - Caixa Postal 37, 37200-000 Lavras - MG

688 Um estudo em relao ao erro tipo I e poder de alguns testes de comparaes mltiplas, foi feito por Perecin e Barbosa (1988), que verificaram que as taxas de erro tipo I para o teste de Duncan eram quase to elevadas quanto as do teste t, e que o teste de Tukey possua poder muito reduzido. Sendo assim, concluram que estes procedimentos no devem ser empregados indiscriminadamente. Observaram que o teste t-bayesiano concilia, de certa forma, as caractersticas desejveis de poder alto e baixas taxas de erro tipo I. Entretanto, como dependem do nmero de tratamentos e da magnitude de seus efeitos, essas taxas no podem ser previstas com exatido. E o procedimento Newman-Keuls o que pode ser aplicado sem maiores cuidados, pois possui poder muito superior e taxas de erro tipo I similares s de Tukey. Entre os procedimentos encontrados no referido estudo, est o chamado, por eles, de Newman-Keuls modificado. No teste original de Newman-Keuls, no se consideram diferenas significativas entre mdias que esto entre duas outras, cuja diferena no significativa, a partir de mdias de tratamentos ordenadas. Neste trabalho, quando no foi considerado este fato, o procedimento foi chamado de Newman-Keuls modificado. Utilizando simulao de Monte Carlo, Bernhardson (1975) realizou um estudo baseado em 1.000 experimentos com n = 15 e nvel nominal de significncia de 5%. Cada populao distribuda normalmente com mdia 50 e desvio padro 15. O nmero de tratamentos foi p variando de 2(2)10, (de 2 a 10, variando de 2 em 2). Concluiu-se que medida que o nmero de tratamentos aumentou, os procedimentos HSD, SNK e de Scheff, quanto taxa de erro por comparao, tenderam a ficar muito abaixo do nvel nominal adotado. O procedimento de Duncan teve suas taxas menores tambm, mas em menor escala, e o LSD permaneceu oscilando em torno do nvel nominal de 5%. Quanto taxa de erro por experimento, o procedimento de Scheff teve comportamento semelhante ao da taxa de erro por comparao; o HSD e SNK se igualaram em torno do nvel nominal adotado; o mtodo de Duncan ficou prximo a 35% para n = 10 e o LSD para este mesmo n ultrapassou 60%. Em estudos de desempenho de testes estatsticos, muitas vezes torna-se bastante complicado obter, analiticamente, informaes sobre as taxas de erro tipo I e poder do teste. Uma maneira de se obter as informaes desejadas de maneira eficiente atravs do mtodo de Monte Carlo, fazendo com que resultados possam ser obtidos de maneira mais simples, evitando as dificuldades analticas, (Smith e Gelfand, 1992). Fazendo-se a comparao entre os valores encontrados analiticamente e os valores encontrados pelo mtodo de Monte Carlo, Boardman e Moffitt (1971) concluram que a diferena encontrada muito pequena, o que faz deste mtodo um timo procedimento para este fim. Os resultados encontrados por eles so extremamente semelhantes aos encontrados por Bernhardson (1975), o que, mais uma vez, traz evidncias favorveis sua utilizao como ferramenta til na compreenso de procedimentos para se comparar mdias de tratamentos. A literatura ampla no que diz respeito a testes de comparaes mltiplas, o que facilita a sua aplicao por pesquisadores de diferentes reas. Contudo, muitas vezes torna-se difcil a interpretao dos resultados por no apresentarem uma real separao de grupos de mdias devido ambigidade nos resultados. Com o objetivo de eliminar essa ambigidade, foram apresentados na literatura mtodos aglomerativos, como o caso do procedimento proposto por Scott e Knott (1974). O presente trabalho teve por objetivo avaliar o poder e as taxas de erro tipo I do teste proposto por Scott e Knott (1974), em amplas situaes experimentais com relao preciso, nmero de tratamentos, nmero de repeties e nvel de significncia adotado, atravs de simulao de Monte Carlo. METODOLOGIA Atravs de um programa implementado em Pascal, foram simulados 192.000 experimentos em uma primeira etapa e 60.000 numa segunda, num total de 252.000 experimentos. Para isso, geraram-se dados de experimentos, seguindo-se o modelo: yij = + ti + eij em que: yij representa uma resposta simulada obtida do tratamento i na repetio j; a mdia geral arbitrada como 100 (sem perda de generalidade); ti o efeito do i-simo tratamento (ti = 0); e eij (i = 1, 2, ..., p; j = 1, 2, 3,... ,r) o erro aleatrio, gerado independentemente com distribuio normal com mdia zero e desvios padres determinados a partir de diferentes precises. As simulaes foram feitas gerando-se 2000 experimentos para cada situao em duas etapas: Etapa A As simulaes foram feitas para as diversas combinaes entre o nmero de tratamentos (p = 5, 10, 20 e 80), o nmero de repeties (r = 4, 10 e 20), o nvel nominal de significncia igual a 1% e 5%, e os coeficientes de variao iguais a 1%, 10%, 20% e 30%. Nessa etapa, os dados foram gerados com o interesse especfico de estudar as taxas de erro por compa-

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

689 rao e por experimento. Por isso, foi considerada a no-existncia de efeito de tratamento, aqui referenciada como situao de nulidade completa: i = ( i = 1, 2, , p). O teste de Scott-Knott foi aplicado a todos os 2.000 experimentos gerados em cada situao e foram computados os valores das taxas de erro tipo I. Para decidir se estas eram semelhantes aos nveis nominais estabelecidos, calculou-se um limite mximo para que estes valores pudessem assumir. Este limite foi estabelecido utilizando-se o intervalo de confiana exato para propores (Leemis e Trivedi, 1996). Os limites superiores encontrados para igual a 1% e 5% so 1,727044% e 6,391386%, respectivamente, e os inferiores so 0,518787% e 3,828164%. Assim, os valores que superaram esses limites no foram considerados semelhantes aos nveis nominais de significncia. Etapa B Nesta segunda etapa, as simulaes foram feitas para as diversas combinaes entre o nmero de tratamentos (p = 5, 10, 20 ,40 e 96), mesmo nmero de repeties e nveis nominais de significncia da etapa A, com diferena entre tratamentos adjacentes, quando esta existia, igual a dois erros padro da mdia (2 x ). O erro padro dado por x = / n . Neste caso, o C.V. foi fixado em 10%, uma vez que os efeitos de tratamentos eram vinculados ao erro padro da mdia. Esta etapa, agora referenciada como situao de nulidade parcial, 1 = 2 i ( i = 3, 4, , p), foi assim estabelecida para que pudessem ser gerados dados que trouxessem informaes sobre o poder e a taxa de erro tipo I, quando em presena de tratamentos com efeitos diferentes. Neste caso, como apenas os efeitos de dois tratamentos so iguais, as taxas de erro por comparao e por experimento coincidem, conforme Boardmam (1971). Novamente aplicou-se o teste de Scott-Knott para todos os 2.000 experimentos de cada situao e computaram-se as taxas de erro tipo I e o poder. Os critrios para decidir se as taxas de erro tipo I encontradas eram semelhantes s dos nveis nominais estabelecidos, foram exatamente os mesmos descritos anteriormente na etapa A. Para medir o poder do teste, os resultados significativos foram computados para os contrastes envolvendo diferenas de 2, 4, 6, 8 e 10 erros padro da mdia, em todas as situaes especificadas. RESULTADOS E DISCUSSO No que se refere aos resultados das simulaes, as Tabelas 1 e 2 mostram a porcentagem de deciso correta do teste de Scott-Knott (poder do teste), para os nveis nominais de significncia = 1% e = 5%, respectivamente. Observa-se, pelas Tabelas 1 e 2, que o poder do teste tendeu a aumentar com o aumento do nmero de tratamentos de 5 para 10, e que essa tendncia foi mais clara quando a diferena real entre mdias foi de 2 x . Esse acrscimo tambm foi bastante influenciado pelo aumento no nmero de repeties, principalmente de 4 para 10, ainda que influenciando menos do que o nmero de tratamentos. Percebese que com 96 tratamentos, quase no houve diferena no poder alterando-se o nmero de repeties, embora o mesmo no possa ser dito para 5 tratamentos, por exemplo. Isso pode ser devido ao fato de se obterem estimativas mais confiveis para a varincia residual, pois com muitos tratamentos, independentemente do nmero de repeties, os graus de liberdade residuais so elevados. J para poucos tratamentos, os graus de liberdade residuais sero pequenos, com poucas repeties e elevados, com muitas repeties, destacando-se, assim, o seu maior efeito nesta situao, uma vez que a preciso do experimento foi fixada, adotandose diferenas constantes entre tratamentos consecutivos de 2 x . Como era de se esperar, medida que a magnitude da diferena entre mdias consecutivas aumentou, a porcentagem de decises corretas melhorou de desempenho rapidamente, de tal modo que com 6 x , o poder do teste pde ser considerado muito bom, exceto pelo valor 68,53 (Tabela 1), registrado para o nvel nominal de 1%, com apenas 4 repeties e 5 tratamentos, que esteve bem abaixo dos demais, com a mesma diferena real entre mdias. Esses resultados esto de acordo com os de Perecin e Barbosa (1988) para o nvel de 5%, os quais comentam que os testes de comparaes mltiplas possuem elevado poder quando as diferenas entre as mdias de tratamentos diferem de 6 ou mais erros padres. O primeiro bloco da Tabela 2, com nmero de repeties igual a 4, pode ser comparado aos resultados obtidos por Perecin e Barbosa (1988). As Figuras 1 e 2 apresentadas, a seguir, mostram o desempenho do teste de Scott-Knott, em relao aos procedimentos de comparaes mltiplas estudados pelos autores citados, nas mesmas condies experimentais.

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

690 TABELA 1 - Poder do teste de Scott-Knott, ao nvel nominal de significncia = 1%, em funo do nmero de tratamentos, nmero de repeties e erro padro da mdia ( x ). No de repeties No de Tratamentos 05 10 4 20 40 96 05 10 10 20 40 96 05 10 20 20 40 96 2 x 23,73 36,32 39,46 40,82 41,27 32,66 37,91 39,96 41,22 41,39 34,25 38,09 40,12 41,23 41,59 Diferena real entre mdias 4 x 57,03 73,20 76,36 77,22 76,73 76,40 76,58 77,32 77,87 77,13 78,37 77,11 77,68 77,79 77,15 6 x 68,53 93,92 95,85 96,25 95,99 92,18 96,33 96,68 96,66 96,19 95,55 96,64 96,72 96,55 96,19 8 x 99,45 99,77 99,85 99,87 99,95 99,91 99,93 99,87 99,92 99,88 99,89 99,89 10 x 99,99 99,99 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00

Quando considerada apenas diferenas de 2 x , o teste de Scott-Knott apresentou-se sempre superior aos demais. Verificou-se que a porcentagem de decises corretas foi bem maior do que a do teste t-bayesiano, que Perecin e Barbosa (1988) consideraram como o de maior poder em seu estudo. E quando comparado ao de Tukey, teste amplamente utilizado por pesquisadores das mais diversas reas, foi indiscutivelmente superior. Os testes SNK, SNK modificado, t e Duncan apresentaram poderes bem menores do que os de Scott-Knott, mas no to baixos como os de Tukey. Os testes de SNK modificado, Duncan e t apresentaram praticamente o mesmo poder, como mostra a sobreposio encontrada para as trs curvas (Figura 1).

Na situao da Figura 2, para um pequeno nmero de tratamentos, o teste de Scott-Knott apresentouse ligeiramente superior ao t-bayesiano, situao que se inverteu para os demais casos com maior nmero de tratamentos. A diferena continuou sendo muito grande em relao ao teste de Tukey. Verificou-se tambm uma razovel diferena em favor do Scott-Knott, em relao ao SNK e ao SNK modificado, uma vez que os dois testes em questo apresentaram uma sobreposio de suas curvas. Quanto aos testes de Duncan e de t, a diferena no pde ser considerada grande. Mesmo de posse destas constataes, informaes importantes devem ser obtidas a respeito de suas taxas de erro tipo I. A Tabela 3 apresenta os resultados

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

691 obtidos neste estudo, para situao em que foi referida como situao de nulidade completa. Um aspecto que merece a ateno quando observa-se a Tabela 3, o pequeno nmero de valores que ultrapassaram os limites nominais de significncia de 1% e 5%, quando estudada a taxa de erro por experimento, considerando-se tanto o limite superior quanto o inferior do intervalo de confiana. Alm disso, pde-se notar que todos os valores que ultrapassaram o limite superior foram naquelas situaes em que o nmero de tratamentos era 5, embora no tivessem se distanciado muito dos valores nominais. Para a taxa de erro por comparao, nenhum valor excedeu o nvel nominal adotado. Alm disto, esteve sempre bem abaixo do limite inferior do intervalo de confiana, registrando valores em torno da metade da taxa de erro por experimento. No se observou efeito do coeficiente de variao nas taxas de erro; no entanto, um pequeno nmero de tratamentos (p = 5) poderia causar maiores oscilaes dessa taxa de erro, levando a resultados fora dos esperados nas taxas nominais de 1% e 5%. O fato de que o CV no tenha alterado as taxas de erro por experimento (erro tipo I), foi uma importante constatao, pois na experimentao os pesquisadores utilizam-se de vrios artifcios para abaix-lo, como, por exemplo, transformaes de dados, prtica no indicada para este fim.

TABELA 2 - Poder do teste de Scott-Knott, ao nvel nominal de significncia = 5%, em funo do nmero de tratamentos, nmero de repeties e do erro padro da mdia ( x ). No de repeties No de tratamentos 05 10 4 20 40 96 05 10 10 20 40 96 05 10 20 20 40 96 2 x 39,45 44,34 46,39 47,20 48,45 40,54 45,03 46,51 47,40 48,56 41,24 44,98 46,45 47,43 48,62 Diferena real entre mdias 4 x 81,42 82,36 83,46 83,61 84,29 84,02 83,79 83,61 83,92 84,42 84,67 83,60 83,86 83,82 84,46 6 x 95,78 97,67 98,24 98,27 98,35 98,40 98,29 98,44 98,40 98,38 98,78 98,48 98,42 98,42 98,41 8 x 99,93 99,98 99,97 99,98 99,96 99,98 99,97 99,98 99,98 99,98 99,98 99,97 10 x 99,99 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00 100,00

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

692

60 55 50

Scott e Knott t-bayesiano SNK modificado Duncan t SNK Tukey

% decises corretas

45 40 35 30 25 20 15 10 5 0 05 10 20 40 96/100

Nmero de tratamentos
FIGURA 1 - Poder do teste para os diversos procedimentos de comparaes mltiplas em funo do nmero de tratamentos, considerando a diferena real entre mdias igual a 2 x e nvel nominal de significncia de 5%.

100 90 80

t-bayesiano Scott e Knott t Duncan SNK SNK modificado Tukey

% decises corretas

70 60 50 40 30 20 10 0 05 10 20 40 96/100

Nmero de tratamentos
FIGURA 2 - Poder do teste para os diversos procedimentos de comparaes mltiplas em funo do nmero de tratamentos, considerando a diferena real entre mdias igual a 4 x e nvel nominal de significncia de 5%. Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

693 TABELA 3 - Taxas de erros por comparao (TPC) e por experimento (TPE), para o teste de Scott-Knott, em funo do nmero de repeties (REP), nmero de tratamentos (TRAT), coeficientes de variao (CV) e nveis nominais de significncia =1% e =5%.
REP 4 4 4 4 10 10 10 10 20 20 20 20 4 4 4 4 10 10 10 10 20 20 20 20 4 4 4 4 10 10 10 10 20 20 20 20 4 4 4 4 10 10 10 10 20 20 20 20 TRAT 5 5 5 5 5 5 5 5 5 5 5 5 10 10 10 10 10 10 10 10 10 10 10 10 20 20 20 20 20 20 20 20 20 20 20 20 80 80 80 80 80 80 80 80 80 80 80 80 CV 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1 10 20 30 1% %TPC 0,13 ** 0,42 ** 0,32 ** 0,22 ** 0,67 0,47 ** 0,57 0,54 0,54 1,09 0,73 0,69 0,30 ** 0,24 ** 0,21 ** 0,25 ** 0,55 0,53 0,41 ** 0,41 ** 0,66 0,59 0,40 ** 0,77 0,17 ** 0,22 ** 0,25 ** 0,33 ** 0,31 ** 0,41 ** 0,41 ** 0,44 ** 0,42 ** 0,55 0,54 0,50 ** 0,27 ** 0,17 ** 0,37 ** 0,33 ** 0,47 ** 0,37 ** 0,37 ** 0,47 ** 0,50 ** 0,55 0,47 ** 0,55 %TPE 0,25 ** 0,70 0,60 0,45 ** 1,25 0,85 1,15 1,00 1,05 2,10 * 1,35 1,25 0,65 0,45 ** 0,40 ** 0,55 1,10 1,05 0,85 0,80 1,35 1,20 0,80 1,55 0,35 ** 0,45 ** 0,55 0,65 0,65 0,85 0,80 0,90 0,85 1,10 1,15 1,05 0,55 0,35 ** 0,75 0,65 0,95 0,75 0,75 0,95 1,00 1,10 0,95 1,10 %TPC 3,47 ** 2,78 ** 3,35 ** 2,85 ** 3,11 ** 3,54 ** 3,42 ** 3,31 ** 3,41 ** 3,14 ** 3,49 ** 3,41 ** 2,12 ** 2,05 ** 2,11 ** 2,48 ** 2,61 ** 3,07 ** 2,81 ** 2,68 ** 2,45 ** 2,47 ** 2,76 ** 2,42 ** 2,16 ** 1,86 ** 1,82 ** 1,91 ** 2,28 ** 2,51 ** 2,42 ** 2,49 ** 2,98 ** 2,74 ** 2,21 ** 2,56 ** 1,74 ** 1,74 ** 1,69 ** 1,81 ** 2,27 ** 2,55 ** 2,41 ** 1,75 ** 2,31 ** 2,45 ** 2,43 ** 2,70 ** 5% %TPE 6,60 * 5,05 6,15 5,40 5,90 6,65 * 6,30 6,35 6,25 5,85 6,65 * 6,40 * 4,20 4,25 4,35 4,90 5,25 6,15 5,70 5,45 5,05 5,10 5,65 5,15 4,40 3,80 ** 3,75 ** 4,00 4,80 5,15 5,00 5,05 6,10 5,55 4,55 5,35 3,55 ** 3,55 ** 3,45 ** 3,70 ** 4,60 5,15 4,90 3,55 ** 4,70 5,00 4,95 5,50

* Ultrapassou o limite superior do I.C. exato, com 99% de confiana para os nveis nominais de significncia de 1% (1,727044) e 5% (6,391386). ** Ultrapassou o limite inferior do I.C. exato, com 99% de confiana para os nveis nominais de significncia de 1% (0,518787) e 5% (3,828164). Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

694 Com essas constataes, pode-se dizer que o teste de Scott-Knott controlou bem os dois tipos de taxas de erro tipo I, tanto a taxa por experimento como a por comparao. No entanto, para um pequeno nmero de tratamentos (p = 5), os nveis empricos superaram significativamente os nominais em algumas situaes. A taxa de erro por comparao emprica, por outro lado, foi controlada em todas as situaes no que se refere ao limite superior, quase sempre menor do que a taxa nominal e sempre inferior taxa emprica de erro por experimento. Ao se comparar tais resultados com os obtidos por Bernhardson (1975), pode-se dizer que o teste de Scott-Knott conservador, embora no tanto quanto os testes de Tukey, Scheff e SNK. Porm, tambm no atinge nveis elevados como os procedimentos de Duncan e LSD, que atingem taxas de mais de 40% para 10 tratamentos. Levando-se em conta o trabalho de Carmer e Swanson (1973), que utilizaram os resultados mdios das situaes com um C.V. de 10%, nvel nominal de 5% e nmero de repeties igual a 3, 4, 6 e 8, os valores encontrados para a taxa de erro por comparao do teste de Scott-Knott, embora sempre abaixo dos nveis nominais estabelecidos, foram um pouco maiores que os encontrados pelo procedimento tbayesiano. Para p = 5, 10 e 20 as taxas de erro por comparao foram de 3,37%, 1,50% e 0,58%, respectivamente. Em contrapartida, os valores registrados para taxa de erro por experimento do procedimento tbayesiano (15,6%, 18,4% e 18,7%) foram quase trs vezes maior do que os encontrados para o Scott-Knott, para os mesmos nmeros de tratamentos considerados anteriormente. Outro fato relevante foi comentado por Perecin e Barbosa (1988) sobre as baixas taxas de erro tipo I do teste t-bayesiano que, no entanto, no podem ser previstas com exatido, por dependerem do nmero de tratamentos e da magnitude de seus efeitos. Uma outra maneira de se medir a taxa de erro tipo I, no encontrada na literatura, atravs da etapa em que as simulaes foram realizadas levando-se em conta a referida situao de nulidade parcial. Essa taxa est apresentada na Tabela 4, para cada situao realizada. Segundo Boardman e Moffitt (1971), no tem mais sentido falar em taxas de erro por experimento e por comparao, pois elas se igualam quando apenas duas mdias de tratamentos so iguais, como na hiptese em questo. Por esse motivo, nesta etapa do estudo ser referida apenas a taxa de erro tipo I. Dedicando ateno Tabela 5, observa-se que a grande maioria dos valores ultrapassou os nveis nominais de significncia estabelecidos, embora estes valores no tivessem se afastado muito dos valores nominais. Apenas dois valores estiveram abaixo do limite superior do intervalo de confiana, um para o nvel nominal de 1% e um para o nvel de 5%. Os demais oscilaram sempre acima, embora no se distanciando muito do desejado, com uma leve tendncia de crescimento, medida que o nmero de tratamentos aumentou. Poder-se-ia inferir que, sob situao de nulidade parcial, haveria um indicativo de que as taxas de erro fossem maiores que os nveis nominais. No entanto, algumas ressalvas devem ser consideradas. Nesse caso, as taxas de erro tipo I, como j comentado, podem ser consideradas como taxas de erro por comparao ou por experimento, pois apenas uma comparao realizada por experimento. Os resultados observados na Tabela 3 mostraram que com poucos tratamentos (p = 5), as taxas de erro por experimento apresentaram oscilaes maiores e, eventualmente, superaram os nveis nominais significativamente. Portanto, novos estudos poderiam ser realizados, para que pudessem ser esclarecidas as razes do aumento das taxas de erro tipo I, diferenciando o efeito da situao de nulidade parcial do pequeno nmero de tratamentos com efeitos iguais envolvidos. Convm salientar que, embora o delineamento inteiramente casualizado tenha sido escolhido por ser o mais simples e por ser o mais utilizado na literatura para este fim, os resultados e concluses obtidos a partir destas simulaes podem ser estendidos para os demais delineamentos. Isso devido ao fato das mdias dos tratamentos e o quadrado mdio do resduo (QMR), necessrios para o clculo da estatstica do teste de ScottKnott, terem sido obtidos atravs de uma amostra gerada seguindo as pressuposies exigidas de normalidade e independncia dos erros, os quais possuam mdia zero e varincia constante. A utilizao do teste de Scott-Knott recomendada por possuir poder elevado, taxas de erro tipo I quase sempre de acordo com os nveis nominais e por apresentar resultados com ausncia de ambigidade. CONCLUSES a) Quando se compara o teste de Scott-Knott aos testes de Tukey, t, Scheff, Newman-Keuls, NewmanKeuls modificado e t-bayesiano, aquele apresentou maior poder quando as comparaes entre mdias diferiram em 2 erros padres. Para 4 erros padres de diferena, o poder foi semelhante ao do teste t-bayesiano e, nos demais casos (6, 8 e 10 x ), comportou-se de maneira similar a todos os testes. Foi influenciado pelo nmero de tratamentos, sendo que o aumento no nmero de tratamentos provocou o aumento do poder.

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

695 TABELA 4 - Taxa de erro tipo I para os nveis nominais de significncia =1% e =5%, em funo do nmero de repeties e do nmero de tratamentos. Nvel Nominal de Significncia 1% 5 10 4 20 40 96 5 10 10 20 40 96 5 10 20 20 40 96 0,65 2,30 3,55 3,20 2,95 2,85 3,10 2,75 3,50 3,75 3,05 3,80 3,50 4,30 4,40 5% 6,20 7,15 7,90 8,00 8,20 6,65 7,95 8,15 8,45 8,30 7,25 7,75 7,35 7,05 8,30

No de Repeties

No de Tratamentos

b) Quanto ao erro tipo I, existe um indicativo de aumento da sua taxa emprica, na situao em que se utilizou a situao de nulidade parcial. c) A taxa de erro por experimento, quando considerados os resultados obtidos na situao de nulidade completa, quase sempre esteve de acordo com os nveis nominais estabelecidos. Em todas as situaes estudadas, a taxa de erro tipo I por comparao sempre esteve de acordo com os nveis nominais estabelecidos, e foi sempre inferior taxa de erro por experimento. REFERNCIAS BIBLIOGRFICAS BERNHARDSON, C.S. Type I error rates when multiple comparison procedures follow a significant F test of ANOVA, Biometrics, Washington, v. 31, n.1, p. 337-340, Mar. 1975. BOARDMAN, T.J.; MOFFITT, D.R. Graphical Monte Carlo Type I error rates for multiple comparison procedures, Biometrics, Washington, v. 27, n.3, p. 738-744, Sept. 1971.

CARMER, S. G.; SWANSON, M. R. Detection of differences between means: a Monte Carlo study of five pairwise multiple comparison procedures. Agronomy Journal, Madison, v. 63, n.6, p.940945, Nov./Dec. 1971. CARMER, S. G.; SWANSON, M. R. An evaluation of ten pairwise multiple comparison procedures by Monte Carlo methods. Journal American Statistical Association, Washington, v. 68, n.341, p.66-74, Mar. 1973. LEEMIS, L.; TRIVEDI, K. S. A comparison of approximate interval estimators for the Bernoulli parameter. The American Statistician, Alexandria, v. 50, n. 1, p. 63-68, Feb. 1996. MOOD, A. M.; GRAYBILL, F. A.; BOES, D. C. Introduction to the theory of statistics. 3. ed. New York: Wiley & Sons, 1974. 564 p. PERECIN, D.; BARBOSA, J. C. Uma avaliao de seis procedimentos para comparaes mltiplas. Revista de Matemtica e Estatstica, Marlia-SP, v. 6, p. 95-103. 1988.

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

696 SCOTT, A. J.; KNOTT, M. A cluster analysis method for grouping means in the analysis of variance. Biometrics, Washington, v. 30, n.3, p. 507-512, Sept. 1974. SMITH, C. W. Bayes least significance difference: a review and comparison. Agronomy Journal, Madison, v. 70, n.1, p. 123-127, Jan./Feb. 1978. SMITH, C. W.; GELFAND, A. E. Bayesian statistics without tears: a sampling-resampling perspective. The American Statistician, Alexandria, v. 46, p. 84-88, May. 1992. STEEL, R.G.D.; TORRIE, J.H. Principles and procedures of statistics. 2. ed. New York: McGraw-Hill Book, 1980.633 p.

Cinc. agrotec., Lavras, v.23, n.3, p.687-696, jul./set., 1999

S-ar putea să vă placă și