Regressão polinomial

Concluído

Até agora, vimos apenas modelos de regressão linear, modelos que podem ser modelados como linhas retas. No entanto, os modelos de regressão podem funcionar com praticamente qualquer outro tipo de relação.

O que é regressão polinomial?

Os modelos de regressão modelam regressões como tipos específicos de curva. As polinomiais são uma família de curvas, variando de formas simples a complexas. Quanto mais parâmetros na equação (modelo), mais complexa é a curva.

Por exemplo, uma polinomial de dois parâmetros é simplesmente uma linha reta:

y = interceptação + B1*x

Diagrama mostrando um gráfico de regressão polinomial de dois parâmetros.

A polinomial de três parâmetros, por sua vez, tem uma única curvatura:

y = interceptação + B1*x + B2*x2

Diagrama mostrando um gráfico de regressão polinomial de três parâmetros.

E uma polinomial de quatro parâmetros pode ter duas curvaturas:

y = interceptação + B1*x + B2*x2 + B3*x3

Diagrama mostrando um gráfico de regressão polinomial de quatro parâmetros.

Polinomial comparada a outras curvas

Há diversos tipos de curvas, como curva logarítmica e curva logística, e todas elas podem ser usadas com a regressão.

Diagrama mostrando curvas polinomiais, logarítmicas e logísticas.

Uma grande vantagem da regressão polinomial é que ela pode ser usada para examinar todos os tipos de relações. Por exemplo, a regressão polinomial pode ser usada para relações que são negativas em um determinado intervalo de valores de recursos, mas positivas em outros. Ela também pode ser usada quando o rótulo (valor y) não tiver limite superior teórico.

Diagrama mostrando curvas polinomiais, logarítmicas e logísticas com pontos de plotagem na curva polinomial.

A principal desvantagem das curvas polinomiais é que elas geralmente extrapolam de maneira insatisfatória. Em outras palavras, se tentarmos prever valores maiores ou menores do que nossos dados de treinamento, as polinomiais podem prever valores extremos irreais. Outra desvantagem é que é fácil sobreajustar uma curva polinomial. Isso significa que um ruído nos dados pode alterar a forma da curva de maneira muito mais significativa do que em modelos mais simples, como na regressão linear simples.

Diagrama mostrando uma curva polinomial incorreta com plotagens.

As curvas podem ser usadas com vários recursos?

Vimos como a regressão múltipla pode ajustar várias relações lineares ao mesmo tempo. No entanto, não há necessidade de que eles sejam limitados a relações lineares. Todos os tipos de curvas podem ser usados nessas relações quando for apropriado. Apesar disso, deve-se ter o cuidado de não usar curvas como as polinomiais com vários recursos quando elas não forem necessárias. Isso ocorre porque as relações podem acabar muito complexas, o que torna mais difícil entender os modelos e avaliar se eles farão previsões que não fazem sentido do ponto de vista do mundo real.