Громадянам України

Як знайти найважливішу змінну в логістичній регресії?

Найпростішим способом обчислення важливості ознаки в бінарній логістичній регресії є використовуючи коефіцієнти моделі. Коефіцієнти представляють зміну логарифмічних шансів для зміни змінної предиктора на одну одиницю. Більші абсолютні значення вказують на сильніший зв’язок між предиктором і цільовою змінною. 9 травня 2024 р.

Загальним правилом є розглядати змінну предиктора з найбільшим стандартизованим коефіцієнтом регресії як найважливішу змінну; змінна предиктора з наступним за величиною стандартизованим коефіцієнтом регресії як наступною важливою змінною і так далі.

Емпіричне правило: вибрати всі змінні, значення p < 0,25 разом із змінними, що мають відоме клінічне значення. Крок 2. Підберіть модель множинної логістичної регресії за допомогою змінних, вибраних на кроці 1. Перевірте важливість кожної змінної в цій множинній моделі за допомогою статистики Вальда.

Загальні найкращі гіперпараметри для оптимізації моделі машинного навчання логістичної регресії:

  1. Пенальті. Значення параметрів, які використовуються в цьому гіперпараметрі: …
  2. tol (толерантність) …
  3. C (зворотній до регуляризації) …
  4. Розв'язувач. …
  5. max_iter. …
  6. Багатослівний. …
  7. n_jobs.

Ця ймовірність називається p-значенням і вказує, наскільки ймовірно, що змінна є незначущою. Як правило, низьке значення p (менше 0,05) означає, що ви можете відхилити нульову гіпотезу та зробити висновок про значущість змінної.

Найпростішим способом обчислення важливості ознаки в бінарній логістичній регресії є використовуючи коефіцієнти моделі. Коефіцієнти представляють зміну логарифмічних шансів для зміни змінної предиктора на одну одиницю. Більші абсолютні значення вказують на сильніший зв'язок між предиктором і цільовою змінною.