Як знайти найважливішу змінну в логістичній регресії?
Найпростішим способом обчислення важливості ознаки в бінарній логістичній регресії є використовуючи коефіцієнти моделі. Коефіцієнти представляють зміну логарифмічних шансів для зміни змінної предиктора на одну одиницю. Більші абсолютні значення вказують на сильніший зв’язок між предиктором і цільовою змінною. 9 травня 2024 р.
Загальним правилом є розглядати змінну предиктора з найбільшим стандартизованим коефіцієнтом регресії як найважливішу змінну; змінна предиктора з наступним за величиною стандартизованим коефіцієнтом регресії як наступною важливою змінною і так далі.
Емпіричне правило: вибрати всі змінні, значення p < 0,25 разом із змінними, що мають відоме клінічне значення. Крок 2. Підберіть модель множинної логістичної регресії за допомогою змінних, вибраних на кроці 1. Перевірте важливість кожної змінної в цій множинній моделі за допомогою статистики Вальда.
Загальні найкращі гіперпараметри для оптимізації моделі машинного навчання логістичної регресії:
- Пенальті. Значення параметрів, які використовуються в цьому гіперпараметрі: …
- tol (толерантність) …
- C (зворотній до регуляризації) …
- Розв'язувач. …
- max_iter. …
- Багатослівний. …
- n_jobs.
Ця ймовірність називається p-значенням і вказує, наскільки ймовірно, що змінна є незначущою. Як правило, низьке значення p (менше 0,05) означає, що ви можете відхилити нульову гіпотезу та зробити висновок про значущість змінної.
Найпростішим способом обчислення важливості ознаки в бінарній логістичній регресії є використовуючи коефіцієнти моделі. Коефіцієнти представляють зміну логарифмічних шансів для зміни змінної предиктора на одну одиницю. Більші абсолютні значення вказують на сильніший зв'язок між предиктором і цільовою змінною.