Teste de nível de significância máximo para a rejeição da hipótese nula de cada regressor (teste bicaudal)

 

Nesse ponto, devemos observar as diretrizes contidas na NBR 14653-2:2011. Avaliação de bens. Parte 2: Imóveis urbanos. Item 9.2.1, tabela 1, item 5.

Esse teste considera a probabilidade máxima admissível de se rejeitar a hipótese nula quando a mesma é verdadeira (erro tipo I), ou seja, a chance de o teste exibir significância estatística quando na verdade essa significância não está presente – o caso de um falso positivo (HAIR et al., 2009, p. 27).

Em se tratando de um teste de nível de significância máximo para a rejeição da hipótese nula, as regras de decisão são:

 

  \begin{tabular}{W{l}{3cm}W{l}{4cm}W{l}{4cm}} \\  & H_0\ verdadeira & H_0\ falsa \\ \hline  Aceitar H_0 & decisão correta & erro tipo II \\ \hline  Rejeitar H_0 & erro tipo I & decisão correta \\ \hline  \end{tabular}

(Lapponi, 2000, p. 329)

 

 

Escrito de uma outra forma, sem mudar o significado, temos:

  \begin{tabular}{W{l}{3cm}W{l}{4cm}W{l}{4cm}}  & \multicolumn{2}{c}{\textbf{Situação}} \\ \cline{2-3}  \textbf{Decisão} & H_0\ é\ verdadeira & H_0\ é\ falsa \\ \hline  Rejeitar & Erro do tipo I & Não há erro \\ \hline  Não rejeitar & Não há erro & Erro do tipo II \\ \hline  \end{tabular}

(Gujarati, 2006, p. 730)

Os testes abaixo se referem ao exemplo apresentado nesta página na seção Solução matricial I.

A amostra do exemplo contém 7 elementos. No modelo matemático de análise dessa amostra foram consideradas 2 (duas) variáveis independentes, quais sejam: área do terreno e área construída, além do intercepto (constante).

Nessa configuração, o valor crítico é dado por:

 

 \begin{tabular}{W{l}{1.2cm}W{c}{0.2cm}W{l}{4cm}} t_{(1\!-\! \alpha;n\!-\!k\!-\!1)}\ & = &  limite\ na\ estatística-t\ de\ Student\ \\ \alpha\ & = & nível\ de\ confiança \\ 1 - \alpha\ & = & nível\ de\  significância\ máximo \\ n\ & = &  tamanho\ da\ amostra\ \\ k\ & = &  variáveis\ independentes\  inseridas\ no\ modelo\ \end{tabular}

A amostra abaixo será analisada na planilha de regressão linear construída por matrizes, em um modelo foram incluídas duas variáveis independentes.

  \begin{tabular}{w{r}{2cm}w{r}{3cm}w{r}{3cm}w{r}{3cm}}  \multicolumn{1}{c}{\textbf{Itens}} & \multicolumn{1}{c}{\textbf{Área do terreno}} & \multicolumn{1}{c}{\textbf{Área edificada}} & \multicolumn{1}{c}{\textbf{Preço}} \\ \hline 1 & 295,00 & 95,00 & 770.000,00 \\ \hline 2 & 300,00 & 100,00 & 790.000,00 \\ \hline 3 & 300,00 & 100,00 & 790.000,00 \\ \hline 4 & 320,00 & 100,00 & 800.000,00 \\ \hline 5 & 360,00 & 100,00 & 820.000,00 \\ \hline 6 & 300,00 & 125,00 & 900.000,00 \\ \hline 7 & 320,00 & 125,00 & 910.000,00 \\ \hline 8 & 300,00 & 150,00 & 1.010.000,00 \\ \hline 9 & 320,00 & 150,00 & 1.020.000,00 \\ \hline \end{tabular}

Os resultados foram:

 \begin{tabular}{w{l}{3cm}w{l}{4cm}w{r}{3cm}w{r}{3cm}w{r}{4cm}w{r}{4cm}} & Graus de liberdade & Soma dos quadrados & Quadrados médios & Estatística F & Nível de significância \\ \hline Regressão & 2 & 7,47E+10 & 3,74E+10 & 16.749,56 & 0,00\% \\ \hline Resíduo & 6 & 1,34E+07 & 2,23E+06 & ~ & ~ \\ \hline Total & 8 & 7,48E+10 & ~ & ~ & ~ \\ \hline ~ & ~ & ~ & ~ & ~ & ~ \\ ~ & Coeficientes regressores & ~ & Erro padrão & Estatística t & Nível de significância \\ \hline \beta_0 & Interseção & 211.816,61 & 8.808,01 & 24,05 & 0,00\% \\ \hline x_1 & Área do terreno & 473,59 & 25,89 & 18,29 & 0,00\% \\ \hline x_2 & Área edificada & 4.373,68 & 23,90 & 183,02 & 0,00\% \\ \hline \end{tabular}

 

 

Os três graus de fundamentação estabelecidos na NBR 14653-2:2011 e 14653-3:2019 são:

 \begin{tabular}{p{8cm}w{c}{2cm}w{c}{2cm}w{c}{2cm}} \\ & \multicolumn{3}{c}{\textbf{Grau de fundamentação}} \\  \cline{1} \hline  \multicolumn{1}{c}{\textbf{Descrição}} & \multicolumn{1}{c}{\textbf{III}} & \multicolumn{1}{c}{\textbf{II}} & \multicolumn{1}{c}{\textbf{I}} \\ \hline  Nível de significância alfa (somatório do valor das duas caudas) máximo para a rejeição da hipótese nula de cada regressor (teste bicaudal)  &  \multicolumn{1}{c}{10\%} & \multicolumn{1}{c}{20\%} & \multicolumn{1}{c}{30\%} \\  \hline  \end{tabular}

 

E os respectivos valores críticos, para cada um dos graus de fundamentação, são:

 \begin{tabular}{ccc} \\ \textup{Grau de fundamentação} & Nível de significância máximo ( \alpha\ ) & Valor t_{crítico} \\ \hline  I &  30\% &   1,134157 \\  II & 20\% & 1,439756 \\  III & 10\% & 1,943180 \\ \hline  \end{tabular}

 

Na configuração do exemplo, em um nível de significância máximo de 30% (trinta porcento), para o grau de fundamentação I, o valor crítico mínimo a ser atingido para que o coeficiente regressor permaneça na região de rejeição da hipótese nula é 1,134157, conforme consta na tabela dos valores críticos por nível de significância da distribuição-t de Student

O cenário acima será demonstrado visualmente nos gráficos abaixo (GUJARATI, 2006, p. 105).

 

 

 

 

Coeficiente da variável independente: Área do terreno ( x1 )

O coeficiente regressor relativo à variável independente área do terreno se encontra na área de rejeição da hipótese nula; portanto, em relação ao seu respectivo coeficiente regressor, rejeita-se a hipótese nula.

Desse modo, seguindo as orientações contidas nas normas NBR 14653-2:2011, afirma-se que a variável independente área do terreno é estatisticamente relevante para o modelo adotado.

 

 

 

 

 

 

Coeficiente da variável independente: Área construída ( x2 )

O coeficiente regressor relativo à variável independente área construída se encontra na área de rejeição da hipótese nula; portanto, em relação ao seu respectivo coeficiente regressor, rejeita-se a hipótese nula.

Desse modo, seguindo a orientação contida na norma NBR 14653-2:2011, afirma-se que  variável independente área construída é estatisticamente relevante para o modelo adotado.

 

 

 

O coeficiente regressor relativo à variável independente área construída permaneceu na área de rejeição da hipótese nula; portanto, em relação a essa variável, rejeita-se a hipótese nula.

 

 

Intercepto

O intercepto se encontra na área de  rejeição da hipótese nula; desse modo, seguindo as orientações contidas nas normas NBR 14653-2:2011, afirma-se que o intercepto é estatisticamente relevante para o modelo adotado.

 

 

 

 

 

 

 

 

 

 

 

Fontes:
HAIR JR, Joseph F. et al. Análise multivariada de dados. 6. ed. Tradução de Adonai Schlup Sant’Anna. Porto Alegre: Bookman, 2009.

GUJARATI, Damodar N. Econometria básica. Tradução de Maria José Cyhlar Monteiro. Rio de Janeiro: Elsevier, 2006.
LAPPONI, Juan Carlos. Estatística usando Excel. São Paulo: Lapponi Treinamento e Editora, 2000.
LATTIN, James; CARROLL, J. Douglas; GREEN, Paul E. Análise de dados multivariados. Tradução de Harue Avritscher. São Paulo: Cengage Learning, 2011.