Conforme exposto por Gujarati, uma das premissas importantes do modelo de regressão linear clássico é que a variância de cada termo de erro ui, condicionado aos valores selecionados das variáveis explanatórias, é algum número constante igual a σ2. Essa é a premissa da homocedasticidade, ou seja igual (homo) espalhamento (cedasticidade), isto é, igual variância.

A homocedasticidade é um dos pressupostos do modelo de regressão linear e a exigência de que essa análsie seja feita consta na NBR 14653-2:2011, A.2.1.3:

A verificação da homocedasticidade pode ser feita, entre outros, por meio dos seguintes processos:
a) análise gráfica dos resíduos versus valores ajustados, que devem apresentar pontos dispostos aleatoriamente, sem nenhum padrão definido;
b) pelos testes de Park e de White

 

A NBR 14653-3:2019, em seu item A.2.2.3, traz exigência semelhante.

Entretanto, Gujarati faz uma advertência quanto ao teste de White no sentido de que, se o modelo tiver vários regressores, então a inclusão de todos os regressores, seus termos ao quadrado (ou a potências mais elevadas) e seus produtos cruzados podem consumir rapidamente os graus de liberdade e, por conta disso, é necessário ter cautela ao aplicar esse teste.

Com relação ao teste de Park, Gujarati (2006, p. 326), citando Goldfeld e Quandt, adverte que o termo de erro vi que entra na equação de regressão daquele teste pode não atender às pressuposições dos MQO e ser ele próprio heterocedástico.

O teste de Koenker-Bassett se apresenta como sendo uma alternativa válida, uma vez que está embasado nos quadrados dos resíduos; porém, em lugar de usá-los em uma regressão contra um ou mais regressores, é feita uma regressão dos quadrados dos resíduos contra os valores estimados do regressando elevados ao quadrado (NASSER JÚNIOR, 2019, p. 60). Portanto:

 

 \text{Se o modelo da regressão for:} \\ \vspace{0.5cm} \\ y_i = \beta_1 + \beta_2 \cdot x_{2i} + \beta_3 \cdot x_{3i} + \ldots \beta_k \cdot x_{ki} + \epsilon_i \\ \vspace{1cm} \\ \text{Estimamos o modelo, obtemos os valores de}\ \widehat{\epsilon}_i: \\ \vspace{0.5cm} \\ \widehat{\epsilon}_i = y_i - \widehat{y}_i \\ \vspace{1cm} \\ \text{Então, estimamos:} \\ \vspace{0.5cm} \\ \widehat{\epsilon}_i^2 = \alpha_1 + \alpha_2 \cdot \widehat{y}_i^2 + u_i

 

A preferência pelo teste de Koenker-Bassett se deve, ainda, ao fato de que esse teste pode ser aplicado com qualquer número de regressores.

No exemplo apresentado na planilha a análise de heterocedasticidade foi feita a partir do teste de Koenker-Bassett, onde os quadrados dos resíduos foram regredidos contra os quadrados dos valores  previstos.

Neste momento, é necessário observar que a NBR 14653-2:2011, em seu item A.3, A.3.1. e a NBR 14653-3:2019, em seu item A.3, A.3.1 dispõem que o nível de significância máximo admitido nos demais testes estatísticos não deve ser superior a 10% (dez por cento).

 

 \begin{tabular}{lrrrrr} \\\multicolumn{3}{l}{\textbf{RESUMO DOS RESULTADOS}}   ~ & ~ & ~ & \\ ~ & ~ & ~ & ~ & ~ & \\ \multicolumn{3}{l}{\textbf{Estatística de regressão}}  ~ & ~ & ~ & \\ \multicolumn{1}{l}{R múltiplo} & 13,33\% & ~ & ~ & ~ & \\ \multicolumn{1}{l}{R-Quadrado} & 1,78\% & ~ & ~ & ~ & \\ \multicolumn{1}{l}{R-quadrado ajustado} & -1,73\% & ~ & ~ & ~ & \\ \multicolumn{1}{l}{Erro padrão} & 70.202,85 & ~ & ~ & ~ & \\ \multicolumn{1}{l}{Observações} & 30 & ~ & ~ & ~ & \\ ~ & ~ & ~ & ~ & ~ & \\ \textbf{ANOVA} & ~ & ~ & ~ & ~ & \\ \hline & ~ & ~ & ~ & ~ & \\ ~ & \multicolumn{1}{c}{\textsl{gl}} & \multicolumn{1}{c}{\textsl{SQ}} & \multicolumn{1}{c}{\textsl{MQ}} & \multicolumn{1}{c}{\textsl{F}} & \multicolumn{1}{c}{\textsl{F de significação}} \\ {Regressão} & 1 & 2.497.490.547,49 & 2.497.490.547,49 & 0,51 & \textbf{48,24\%} \\ {Resíduos} & 28 & 137.996.333.704,88 & 4.928.440.489,46 & ~ & \\ {Total} & 29 & 140.493.824.252,37 & ~ & ~ & \\  ~ & ~ & ~ & ~ & ~ & \\  \hline ~ & ~ & ~ & ~ & ~ & \\  ~ & \multicolumn{1}{c}{\textsl{Coeficientes}} & \multicolumn{1}{c}{\textsl{Erro padrão}} & \multicolumn{1}{c}{\textsl{Stat t}} & \multicolumn{1}{c}{\textsl{valor-P}} &  \\ {Interseção} & 152.403,61 & 128.107,74 & 1,19 & \textbf{24,42\%} &  \\ {ŷ²} & -0,00 & 0,00 & -0,71 & \textbf{48,24\%} &  \\  & & & & & \\ \hline\end{tabular}

 

No exemplo contido na planilha, o nível de significância F foi superior a 10% (dez por cento), portanto a hipótese nula não pode ser rejeitada; por consequência, não se aceita o modelo. 

Quanto ao nível de significância do coeficiente regressor, ele foi superior a 10% (dez por cento), portanto não se pode rejeitar a hipótese nula, ou seja, não se pode afirmar com segurança estatística que os resíduos dependem da variação dos valores previstos.

A par disso, também foi feita uma análise a partir do gráfico de dispersão e não foi detectado nenhum padrão definido entre os resíduos e os valores previstos pela regressão.

 

 

 

 

A planilha onde o teste foi desenvolvido está disponível abaixo.

Regressao-linear.-Analise-de-heterocedasticidade.-Teste-de-Koenker-Bassett.

 

 

Fontes:
GUJARATI, Damodar. Econometria básica. Tradução de Maria José Cyhlar Monteiro. Rio de Janeiro: Elsevier, 2006.
______. Econometria: princípios, teoria e aplicações práticas; tradução de Cristina Yamagami; revisão técnica de Salvatore Benito Virgilito. São Paulo: Saraiva Educação, 2019.

NASSER JÚNIOR, Radegaz. Avaliação de bens: princípios básicos e aplicações. 3. ed. São Paulo: Editora Leud, 2019.