Regressão simples (RLS)

Em inúmeras problemáticas, o pesquisador depara-se com duas varáveis que proporcionam previsão de comportamentos futuros.

Esta previsão pode ser alcançada através de um estudo que envolve a equação da reta de regressão, concebida através das variáveis critério (y, dependente ou de resposta) e a independente (x, também conhecida como prognóstico).

Trata-se de uma realidade comum no universo da pesquisa, envolvendo variáveis como renda, idade, gastos, entre muitas outras.

Equação da reta

Y = a1 + a2.x

Onde, y é a variável dependente e x a independente.

a1 é o valore de y para x e a2.é valor médio de y por unidade x.

A relação linear entre as duas variáveis é medida pelo coeficiente de correlação (R).

R varia de –1 a 1, onde 1 é a correlação perfeita e o oposto indica forte correlação negativa. Valores próximos de zero indicam fraca correlação.

No exemplo abaixo, se existisse um R elevado poderia-se prever y para eventos futuros.

Y

X

Gastos com combustível

Km rodados

Renda Pessoal

Anos de estudo

Números de defeitos de peças

Horas de treinamentos em qualidade

O cálculo de R é uma operação bastante simples para softwares com funções estatísticas, sendo desnecessário o aprofundamento dos procedimentos de calculo.

Neste tipo de análise é importante determinar o quanto a linha de regressão representa os dados. Neste caso, se faz necessário calcular o R2 de Pearson ou coeficiente de determinação.

Um R2  igual a 0,80, tem-se que 80% da variabilidade decorre de x. Inversamente, pode-se dizer que 20% da variância de Y não é atribuível às diferenças em x.

Para obter-se o teste de hipótese, formula-se H0 e H1 da seguinte forma:

H0 :p = 0

H1: p ≠ 0

O cálculo de t é realizado através da formula,

Sendo t calculado maior do que t tabelado, rejeita-se a hipótese nula.

Exemplo

Um motorista deseja prever seus gastos com seu automóvel em função dos quilômetros que roda por mês.

QUILÔMETROS

GASTOS (R$)

3203

400

3203

400

2603

340

3105

400

1305

150

804

100

1604

200

2706

300

805

100

1903

200

3203

400

3702

450

3203

400

3203

400

803

100

803

100

1102

130

3202

400

1604

150

1603

200

3203

400

3702

450

3403

440

 

Estatística de regressão

R múltiplo

0,993064678

R-Quadrado

0,986177454

R-quadrado ajustado

0,985519237

Erro padrão

127,508336

Observações

23

Observando a tabela acima, percebe-se uma forte correlação entre as variáveis, onde R está muito próximo de 1.

Quilômetros rodados explica 98% da variância de gastos.
Como referenciar: "Regressão simples (RLS)" em Só Matemática. Virtuous Tecnologia da Informação, 1998-2018. Consultado em 16/01/2018 às 13:48. Disponível na Internet em https://www.somatematica.com.br/estat/ap36.php