O objetivo desta seção é demonstrar as ferramentas matemáticas utilizadas para a solução de um sistema linear; essa demonstração é meramente didática, pois atualmente a solução de  um sistema linear se faz através de planilhas eletrônicas. 

Após a coleta e seleção dos dados que irão compor a amostra, constrói-se uma tabela semelhante a esta:

 \begin{tabular}{rrr} Área do terreno & Área construída & Preço no mercado \\ \hline300,00 & 125,00 & 430.000,00 \\ \hline295,00 & 105,00 & 380.000,00 \\ \hline300,00 & 195,00 & 560.000,00 \\ \hline310,00 & 185,00 & 540.000,00 \\ \hline305,00 & 192,00 & 560.000,00 \\ \hline310,00 & 175,00 & 520.000,00 \\ \hline320,00 & 185,00 & 550.000,00 \\ \hline\end{tabular}

 

Podemos transformar essa amostra no seguinte sistema linear:

 \beta_1\ 300,00\ + \beta_2\ 125,00\  =  430.000,00 \\\beta_1\ 295,00\  + \beta_2\ 105,00\ = 380.000,00 \\\beta_1\ 300,00\  + \beta_2\ 195,00\ = 560.000,00 \\\beta_1\ 310,00\  + \beta_2\ 185,00\ = 540.000,00 \\\beta_1\ 305,00\  + \beta_2\ 192,00\ = 560.000,00 \\\beta_1\ 310,00\  + \beta_2\ 175,00\ = 520.000,00 \\\beta_1\ 320,00\ + \beta_2\ 185,00\ = 550.000,00

 

 

Nesse sistema, as matrizes principais são:

 X\ (matriz\ modelo)\ = \begin{bmatrix} 300,00 & 125,00 \\ 295,00 & 105,00 \\ 300,00 & 195,00 \\ 310,00 & 185,00 \\ 305,00 & 192,00 \\ 310,00 & 175,00 \\ 320,00 & 185,00 \end{bmatrix}, \qquad y = \begin{bmatrix} 430.000,00 \\ 380.000,00 \\ 560.000,00 \\ 540.000,00 \\ 560.000,00 \\ 520.000,00 \\ 550.000,00 \end{bmatrix} .

 

Cabe-nos, agora, calcular as incógnitas (coeficientes regressores) que resolvam o sistema linear acima, ou os valores que forneçam a melhor solução aproximada.

Na análise do sistema linear acima, será inserida uma coluna para representar a constante (intercepto); portanto, a matriz a ser utilizada nos cálculos será:

 X = \begin{bmatrix} 1 & 300,00 & 125,00 \\ 1 & 295,00 & 105,00 \\ 1 & 300,00 & 195,00 \\ 1 & 310,00 & 185,00 \\ 1 & 305,00 & 192,00 \\ 1 & 310,00 & 175,00 \\ 1 & 320,00 & 185,00 \end{bmatrix}

 

A solução matricial desse sistema é dada por:  \^b & = & (X'X)^{-1}X'y onde:

  \begin{tabular}{lcl}  X' & = & matriz transposta de X  \\  (X'X)^{-1} &  = & matriz invertida de X'X \\  \^b  & = & matriz-coluna dos coeficientes regressores \end{tabular}

 

Matriz transposta de  \textsl{X} :

 X' =  \begin{bmatrix} 1 & 1 & 1 & 1 & 1 & 1 & 1 \\ 300,00 & 295,00 & 300,00 & 310,00 & 305,00 & 310,00 & 320,00 \\125,00 & 105,00 & 195,00 & 185,00 & 192,00 & 175,00 & 185,00  \end{bmatrix}

 

Resultado da multiplicação:

 X'X = \begin{bmatrix} 7,00 & 2.140,00 & 1.162,00 \\  2.140,00 & 654.650,00 & 356.335,00 \\  1.162,00 & 356.335,00 & 200.614,00 \\  \end{bmatrix}

 

Inversão matricial:

 (X'X)^{-1} = \begin{bmatrix} 302,871075592 & -1,060191948 & 0,128840998 \\ -1,060191948 & 0,003757214 & -0,000532783 \\ 0,128840998 & -0,000532783 & 0,000205050 \end{bmatrix}

 

O elementos da diagonal principal da matriz  (X'X)^{-1} são 302,871075592, 0,003757214 e 0,000205050.

Sendo:

 X'y = \begin{bmatrix} 3.540.000,00 \\ 1.084.500.000 \\ 603.020.000,00 \end{bmatrix}

 

Os coeficientes regressores são:

 (X'X)^{-1} X'y = \^b \qquad \qquad \therefore \qquad \qquad \begin{bmatrix} 79.138,55 \\ 340,04 \\ 1.943,49 \end{bmatrix}

 

O gráfico que demonstra visualmente os resultados da regressão linear múltipla é o seguinte:

 

 

Cálculo do erro padrão da regressão

 \begin{tabular}{llll} & s_e & = & \sqrt{\dfrac{\sum_i (y_i - \hat{y}_i)^2}{n-k-1}} \\ Onde: & & & \\ & s_e & = & erro padrão da regressão \\ & n & = &  tamanho\ da\ amostra\ \\ & k & = & variáveis\ independentes\ inseridas\ no\ modelo\ \\ \end{tabular}

 

\begin{tabular}{rrrr}\multicolumn{1}{c}{\textbf{Preço no mercado}} & \multicolumn{1}{c}{\textbf{Previsto}}  & \multicolumn{1}{c}{\textbf{Resíduos}} & \multicolumn{1}{c}{\textbf{Resíduos^2}} \\ \hline430.000,00 & 424.087,97 & 5.912,03 & 34.952.098,88 \\ \hline380.000,00 & 383.517,90 & -3.517,90 & 12.375.591,13 \\ \hline560.000,00 & 560.132,48 & -132,48 & 17.551,81 \\ \hline540.000,00 & 544.097,98 & -4.097,98 & 16.793.433,63 \\ \hline560.000,00 & 556.002,22 & 3.997,78 & 15.982.266,34 \\ \hline520.000,00 & 524.663,05 & -4.663,05 & 21.744.023,63 \\ \hline550.000,00 & 547.498,41 & 2.501,59 & 6.257.974,30 \\ \hline~ & ~ & ~ & \\~ & ~ & \textbf{Soma}~ & 108.122.939,72 \\ \hline\end{tabular}

 

 s_e = \sqrt{\dfrac{108.122.939,72}{7-2-1}} = \sqrt{27.030.734,93} = 5.199,11

 

Cálculo do erro padrão de cada coeficiente regressor (incluindo o intercepto)

 \begin{tabular}{llll} \\ &  s_{ck} &  = & s_e \cdot \sqrt{c_k} \\ \vspace{0.5cm} \\ Onde: & & & \\ & s_{ck} & = & erro padrão do coeficiente regressor \\ & s_e & = & erro padrão da regressão \\ & c_k & = & elemento da diagonal principal da matrix (X'X)^{-1}\\ \end{tabular}

 

 sb_0 = 5.199,11 \cdot \sqrt{c_{11}} = 5.199,11 \cdot \sqrt{302,871075592} = 90.481,09

 sb_1 = 5.199,11 \cdot \sqrt{c_{22}} = 5.199,11 \cdot \sqrt{0,003757214} = 318,69

 sb_2 = 5.199,11 \cdot \sqrt{c_{33}} = 5.199,11 \cdot \sqrt{0,000205050} = 74,45

 

 

TESTES DE NÍVEL DE SIGNIFICÂNCIA (ERRO TIPO I)

Teste de nível de significância de cada regressor

A estatística-t é calculada pela razão entre o coeficiente regressor e o seu respectivo erro padrão:

 \begin{tabular}{p{3cm}p{5cm}p{3cm}} Intercepto &  = {79.138,55} \div\ {90.481,09} & = 0,874642 \\ Área do terreno & = {340,04} \div\ {318,69} & = 1,067017 \\ Área construída & = {1.943,49} \div\ {74,45} & = 26,105020 \\ \end{tabular}

 

Nesse ponto, devemos observar as diretrizes contidas na NBR 14653-2:2011. Avaliação de bens. Parte 2: Imóveis urbanos. Item 9.2.1, tabela 1, item 5.

 \begin{tabular}{p{10cm}p{2cm}p{2cm}p{2cm}} \\& \multicolumn{3}{c}{\textbf{Grau de fundamentação}} \\   \multicolumn{1}{c}{\textbf{Descrição}} & \multicolumn{1}{c}{\textbf{III}} & \multicolumn{1}{c}{\textbf{II}} & \multicolumn{1}{c}{\textbf{I}} \\ \hline Nível de significância alfa (somatório do valor das duas caudas) máximo para a rejeição da hipótese nula de cada regressor (teste bicaudal) & \multicolumn{1}{c}{10\%} & \multicolumn{1}{c}{20\%} & \multicolumn{1}{c}{30\%} \\ \hline & & & \\\end{tabular}

 

O nível de significância máximo estabelecido na norma é de 30% (trinta por cento), para o grau de fundamentação I.

A amostra do exemplo acima contém 7 elementos. No modelo matemático de análise dessa amostra foram consideradas 2 (duas) variáveis independentes, quais sejam: área do terreno e área construída, além do intercepto (constante).

Nessa configuração, o valor crítico é dado por:

 \begin{tabular}{lcl} t_{(1\!-\! \alpha;n\!-\!k\!-\!1)}\ & = & \ limite\ na\ estatística-t\ de\ Student\ \\ \alpha\ & = & \textsl{ nível\ de\ significância} \\ 1 - \alpha\ & = & \textsl{ coeficiente}\ de\ significância\ \\ n\ & = & \  tamanho\ da\ amostra\ \\ k\ & = & \ variáveis\ independentes\  inseridas\ no\ modelo\ \end{tabular}

 

Na configuração do exemplo, o valor crítico é 1,189567, conforme consta na tabela da distribuição-t de Student. Os resultados da regressão foram:

 

 \begin{tabular}{lrrrr} \multicolumn{4}{l}{\textbf{Análise da variância (ANOVA)}} \\  & & & \\ ~ & \textsl{Coeficientes} & \textsl{Erro padrão} & \textsl{Estatística-t} & \textsl{valor-P} \\ \hline\textbf{Intercepto} & 79.138,55 & 90.481,09 & 0,874642 & 43,114208\% \\\textbf{Área do terreno} & 340,04 & 318,69 & 1,067017 & 34,608364\% \\\textbf{Área construída} & 1.943,49 & 74,45 & 26,105020 & 0,001279\% \\ \hline\end{tabular}

 

Portanto, em um nível de significância de 30% (trinta por cento), os coeficientes regressores do intercepto e da área do terreno se encontram na região de aceitação da hipótese nula, lembrando que nesse teste:

(1)    \begin{align*} H_0 \colon & \beta_k = 0 \\ H_1 \colon &  \beta_k \neq 0 \end{align*}

 

No caso, a probabilidade de que  \beta_0\ =\  0 é maior do que 30% (trinta por cento) e por isso, com relação a esses coeficientes, a hipótese nula não pode ser rejeitada.

Diga-se o mesmo em relação a  \beta_1 .

A situação pode ser demonstrada visualmente nos dois primeiros gráficos abaixo; observe-se que o primeiro e o segundo coeficientes regressores se encontram na região de aceitação da hipótese nula (GUJARATI, 2006, p. 105).

 

Interseção

O intercepto se encontra na área de aceitação da hipótese nula; portanto, em relação ao intercepto não se pode rejeitar a hipótese nula.

Desse modo, seguindo as orientações contidas nas normas NBR 14653-2:2011 e 14653-3:2019, o intercepto não é estatisticamente útil para o modelo adotado.

 

 

 

Coeficiente da variável independente: Área do terreno ( x1 )

O coeficiente regressor relativo à variável independente área do terreno também se encontra na área de aceitação da hipótese nula; portanto, em relação ao seu respectivo coeficiente regressor, não se pode rejeitar a hipótese nula.

Desse modo, seguindo as orientações contidas nas normas NBR 14653-2:2011 e 14653-3:2019, a variável independente área do terreno não é estatisticamente útil para o modelo adotado.

 

 

 

 

Coeficiente da variável independente: Área construída ( x2 )

O coeficiente regressor relativo à variável independente área construída se encontra na área de rejeição da hipótese nula; portanto, em relação ao seu respectivo coeficiente regressor, pode-se rejeitar a hipótese nula.

Desse modo, seguindo a orientação contida nas normas NBR 14653–2:2011 e 14653-3:2019, afirma-se que  variável independente área construída é estatisticamente útil para o modelo adotado.

 

 

 

Teste de nível de significância do modelo (ensaio F de Snedecor)

Nesse ponto, devemos observar as diretrizes contidas na NBR 14653-2:2011. Avaliação de bens. Parte 2: Imóveis urbanos. Item 9.2.1, tabela 1, item 6.

 

 \begin{tabular}{p{10cm}p{2cm}p{2cm}p{2cm}} \\& \multicolumn{3}{c}{\textbf{Grau de fundamentação}} \\   \multicolumn{1}{c}{\textbf{Descrição}} & \multicolumn{1}{c}{\textbf{III}} & \multicolumn{1}{c}{\textbf{II}} & \multicolumn{1}{c}{\textbf{I}} \\ \hline Nível de significância máximo admitido para a rejeição da hipótese nula do modelo através do teste F de Snedecor & \multicolumn{1}{c}{1\%} & \multicolumn{1}{c}{2\%} & \multicolumn{1}{c}{5\%} \\ \hline & & & \\\end{tabular}

 

O nível de significância máximo para a rejeição da hipótese nula, admitido na norma, é de 5% (cinco por cento), para o grau de fundamentação I.

 \begin{tabular}{lcrrrr}\multicolumn{6}{l}{\textbf{Análise da variância (ANOVA)}} \\ & & & & & \\~ & \textsl{gl} & \textsl{SQ} & \textsl{MQ} & \textsl{F} & \textsl{F de significação} \\ \hline\textbf{Regressão} & 2 & 30.663.305.631,70 & 15.331.652.815,85 & \textbf{567,19} & 0,001235\% \\\textbf{Residual} & 4 & 108.122.939,72 & 27.030.734,93 & ~ & \\\textbf{Total} & 6 & 30.771.428.571,43 & ~ & ~ & \\ \hline\end{tabular}

 

 F = \dfrac{SQReg/k}{SQRes/(n\!-\!k\!-\!1)} = \dfrac{30.663.305.631,70/2}{108.122.939,72/4} = \textbf{567,19}

 \begin{tabular}{lll} Pr(F \textgreater\ 3,23) = 25\% & & \\ Pr(F \textgreater\ 9,24) = 10\% & para gl & N_1 = 4 \\ Pr(F \textgreater\ 19,2) = 5\%  & & N_2 = 2 \\ Pr(F \textgreater\ 99,2) = 1\% & & \\ \\ & Sendo: & N_1 \colon graus\ de\ liberdade\ do\ numerador\ \\ & & N_2 \colon graus\ de\ liberdade\ do\ denominador\ \\ \end{tabular}

 

Os resultados indicam que a regressão atingiu o ponto 567,19 na estatística F, portanto superior a 19,2, que é o limite crítico fixado com base nos graus de liberdade do modelo, em um nível de significância máximo de 5% (cinco por cento). Pode-se, pois, rejeitar a hipótese nula do modelo.

Os pontos percentuais superiores estão disponíveis para consulta na página: Distribuição F.

O resultado do teste F de Snedecor (ou ensaio F de Snedecor) pode ser demonstrado visualmente no gráfico abaixo:

 

 

Análise de normalidade

 \begin{tabular}{rrrrrr} \multicolumn{1}{c}{\textbf{Preço previsto}} & \multicolumn{1}{c}{\textbf{Preço no mercado}} & \multicolumn{1}{c}{\textbf{Resíduo}} & \multicolumn{1}{c}{\textbf{Resíduo padronizado}} & \multicolumn{1}{c}{\textbf{Módulo}} & \multicolumn{1}{c}{\textbf{Resultado}} \\ \hline424.087,97 & 430.000,00 & 5.912,03 & 1,14 & 1,14 & Aceito \\ \hline383.517,90 & 380.000,00 & -3.517,90 & -0,68 & 0,68 & Aceito \\ \hline560.132,48 & 560.000,00 & -132,48 & -0,03 & 0,03 & Aceito \\ \hline544.097,98 & 540.000,00 & -4.097,98 & -0,79 & 0,79 & Aceito \\ \hline556.002,22 & 560.000,00 & 3.997,78 & 0,77 & 0,77 & Aceito \\ \hline524.663,05 & 520.000,00 & -4.663,05 & -1,10 & 1,10 & Aceito \\ \hline547.498,41 & 550.000,00 & 2.501,59 & 0,59 & 0,59 & Aceito \\ \hline\end{tabular}

 

Distância de Cook

A análise detalhada dos resíduos será feita através do relatório gerado pelo programa SisDEA®.

 \begin{tabular}{w{c}{1cm}w{r}{3cm}w{r}{3cm}w{r}{3cm}w{r}{3cm}w{r}{3cm}w{r}{3cm}} \multicolumn{1}{c}{\textbf{Dado}} & \multicolumn{1}{c}{\textbf{Observado}} & \multicolumn{1}{c}{\textbf{Estimado}} & \multicolumn{1}{c}{\textbf{Resíduo}} & \multicolumn{1}{c}{\textbf{Resíduo (\%)}} & \multicolumn{1}{c}{\textbf{Resíduo/DP}} & \multicolumn{1}{c}{\textbf{Distância de Cook}} \\ \hline1 & 430.000,00 & 424.087,97 & 5.912,03 & 1,37\% & 1,137124 & 0,380132 \\ \hline2 & 380.000,00 & 383.517,90 & -3.517,90 & -0,93\% & -0,676634 & 0,757610 \\ \hline3 & 560.000,00 & 560.132,48 & -132,48 & -0,02\% & -0,025482 & 0,000895 \\ \hline4 & 540.000,00 & 544.097,98 & -4.097,98 & -0,76\% & -0,788208 & 0,064291 \\ \hline5 & 560.000,00 & 556.002,22 & 3.997,78 & 0,71\% & 0,768936 & 0,123058 \\ \hline6 & 520.000,00 & 524.663,05 & -4.663,05 & -0,90\% & -0,896894 & 0,076084 \\ \hline7 & 550.000,00 & 547.498,41 & 2.501,59 & 0,45\% & 0,481158 & 0,573950 \\ \hline\end{tabular}

Na doutrina, ao analisar os resultados da estatística de Cook, sugere-se o corte em 1 (um), baseado em uma regra prática (Anderson; Sweeney; Williams, 1999, p. 661).

Não foram detectados pontos influenciantes, pois todos os resultados da estatística de Cook ficaram abaixo de 1 (um), conforme pode ser visualizado no gráfico abaixo.

 

 

 

Os dados acima foram, também, analisados no programa Microsoft Excel® e no programa SisDEA®. Os relatórios gerados por esses programas estão disponíveis para consulta.

 

 
 
 
 
 
 

 

 

Fontes:
ANDERSON, David Ray; SWEENEY, Dennis J.; WILLIAMS, Thomas Arthur. Statistics for business and economics. 7. ed. Cincinatti (Ohio): South-Western College Publishing, 1999.

CHARNET, Reinaldo; FREIRE, Clarice Azevedo de Luna; CHARNET, Eugênia M. Reginato; BONVINO, Heloísa.  Análise de modelos de regressão linear: com aplicações. 2. ed. Campinas,SP: Editora da Unicamp, 2008.
HAIR JR, Joseph F. et al. Análise multivariada de dados. 6. ed. Tradução de Adonai Schlup Sant’Anna. Porto Alegre: Bookman, 2009.

GUJARATI, Damodar N. Econometria básica. Tradução de Maria José Cyhlar Monteiro. Rio de Janeiro: Elsevier, 2006.
SisDEA. PELLI SISTEMAS ENGENHARIA. Disponível em: <https://pellisistemas.com>. Acesso: 2 maio 2024.