Громадянам України

Що означає пояснена дисперсія в регресії?

Що таке пояснена дисперсія? Пояснена дисперсія (також звана поясненою варіацією) – це використовується для вимірювання невідповідності між моделлю та фактичними даними. Іншими словами, це частина загальної дисперсії моделі, яка пояснюється фактично наявними факторами, а не через дисперсію помилок.

Загальна варіація відносно лінії регресії є сумою квадратів різниць між значенням y кожної впорядкованої пари та середнім значенням y. загальна варіація = (𝒚 − 𝒚)𝟐 Пояснена варіація є сума квадратів різниць між кожним прогнозованим значенням y і середнім значенням y.

Якщо пояснена дисперсія висока, це означає, що модель добре підходить для даних, і ми можемо довіряти її прогнозам. З іншого боку, якщо пояснена дисперсія низька, це означає, що модель погано відповідає даним, і нам слід шукати кращу модель.

Пояснена функція регресії дисперсії. Найкраща можлива оцінка – 1,0, нижчі значення гірші. У конкретному випадку, коли y_true є константою, пояснена оцінка дисперсії не є кінцевою: це або NaN (ідеальні передбачення), або -Inf (неідеальні передбачення).

Загальна варіація – це дисперсія в даних. Пояснена варіація – це нахил лінії. Якщо лінія не піднімається, варіації немає. Незрозуміла варіація — це різниця між кожною точкою та лінією.

Значення R-квадрат – це відсоток варіації залежної змінної, який пояснює модель. У множинній регресії це значення є вирішальним, оскільки воно дає вам швидкий знімок ефективності вашої моделі. Якщо ваше значення R-квадрат близьке до 1, ваша модель пояснює значну частину дисперсії.