EDP Sciences EDP Sciences EDP Sciences EDP Sciences

La régression logistique en épidémiologie

de Jean Bouyer (auteur)
Collection : Hors Collection
octobre 2025
Référencer ce produit sur votre site

Présentation

La régression logistique est la méthode la plus utilisée en épidémiologie lorsque la maladie (Y) est caractérisée par une variable en 2 classes ou plus. Elle permet de rechercher et d’analyser des facteurs de risque de la maladie ou ses facteurs pronostics (X), quelle que soit leur nature, qualitative ou quantitative. Les logiciels d’analyse statistique rendent sa mise en oeuvre très facile en pratique, mais n’évitent pas les risques de mésusages ni d’erreurs d’interprétation.

Ce livre détaille le modèle logistique pour caractériser et quantifier la relation entre Y et les variables X. Grâce à ses qualités pédagogiques, la présentation n’est pas réservée aux biostatisticiens, tout en donnant aux épidémiologistes les moyens nécessaires à une bonne compréhension. L’intérêt et les moyens d’intégrer dans un modèle logistique des variables X quantitatives sans les transformer en classes sont largement développés. La modélisation des variables quantitatives par des polynômes fractionnaires ou des fonctions splines est détaillée et accompagnée de fonctions en Stata et en R destinées à présenter les résultats obtenus de façon compréhensible pour le lecteur.

Le choix des variables à inclure dans un modèle logistique, une des questions cruciales de l’analyse des enquêtes épidémiologiques, est longuement présenté et discuté. Cela permet d’aborder la plupart des notions et discussions rencontrées lors de l’analyse des enquêtes épidémiologiques.

Le contenu de ce livre est issu d’un cours intitulé « Épidémiologie quantitative » donné dans le cadre du Master 2 Recherche de Santé publique de la faculté de médecine de l’université Paris-Sud, devenue ensuite université Paris-Saclay. Il s’adresse aux personnes ayant une formation de base en statistique et en épidémiologie (Master 1 de Santé Publique ou CESAM par exemple).

Publié avec le soutien de la Graduate School Santé Publique de l'Université Paris-Saclay.

Sommaire

Préface...................................... 7

Préambule................................. 9

Chapitre 1 Introduction – Le modèle logistique

I. Brève présentation des modèles multivariés.......................................................... 11

II. Le modèle logistique............ 15

III. Modèles linéaires généralisés.................................................................................. 18

IV. Modèle logistique et type d’enquête..................................................................... 20

V. Annexe 1 : Les biais en épidémiologie...................................................................... 22

VI. Annexe 2 : Données d’exemple utilisées et codes informatiques avec Stata et R....... 27

Chapitre 2 Estimation et test des paramètres

I. Vraisemblance d’un échantillon................................................................................. 32

II. Estimation d’un pourcentage par la méthode du maximum de vraisemblance............ 33

III. Application au modèle logistique............................................................................. 36

IV. Tests des paramètres du modèle logistique........................................................ 40

V. Annexe 1 : Estimation des paramètres du modèle logistique avec une seule variable X, dichotomique................... 49

VI. Annexe 2 : Les trois tests issus de la méthode du maximum de vraisemblance..... 51

Chapitre 3 Codage des variables et interprétation des coefficients

I. Règle générale d’interprétation du coefficient d’une variable............................ 54

II. Variable dichotomique......... 55

III. Variable qualitative nominale à plus de deux classes.......................................... 57

IV. Variable qualitative ordinale..................................................................................... 65

V. Variable quantitative........... 71

VI. Prise en compte d’une interaction.......................................................................... 72

VII. Annexe : Comment déterminer si deux modèles sont emboîtés ?.................... 78

Chapitre 4 Modélisation des variables quantitatives

I. Introduction............................ 84

II. Représentation graphique de la relation entre X et Y.......................................... 84

III. Transformer (ou pas) une variable quantitative en classes............................... 87

IV. Les différentes méthodes de modélisation d’une variable quantitative......... 92

V. Données d’exemple.............. 96

VI. Modélisation avec une fonction en escalier.......................................................... 97

VII. Modélisation avec des polynômes......................................................................... 103

VIII. Modélisation avec des polynômes fractionnaires.............................................. 104

IX. Modélisation avec des fonctions splines............................................................... 114

X. Présentation des résultats issus de la modélisation........................................... 127

XI. Fonctions splines ou polynômes fractionnaires ?................................................. 133

XII. Annexes................................ 135

Chapitre 5 Choix des variables à inclure dans un modèle logistique

I. Principes généraux................ 140

II. Nombre maximum de variables.................................... 143

III. Choix des variables « candidates »....................................... 145

IV. Problèmes à considérer lors de la sélection des variables candidates........... 148

V. Sélection des variables à inclure dans le modèle final......................................... 154

VI. Variables à inclure en raison de la structure de l’échantillon, enquêtes multicentriques.. 169

VII. Annexe : Conditions pour qu’une association soit expliquée par un facteur de confusion..170

Chapitre 6 Régressions logistiques multinomiale et ordinale

I. Introduction............................ 174

II. Régression logistique multinomiale.......................................................................... 175

III. Les différents modèles de régression logistique ordinale.................................. 183

IV. Modèle cumulative-odds.... 185

V. Modèle continuation-ratio.. 192

VI. Modèle adjacent-category..................... 197

VII. Choix du modèle................. 200

VIII. Annexes............................... 203

Chapitre 7 Adéquation du modèle

I. Introduction............................ 207

II. Mesure de l’écart entre les observations et les prédictions du modèle logistique..... 209

III. Tests d’adéquation.............. 212

IV. Courbe ROC.......................... 217

V. Diagnostics de régression.. 220

Références............................... 229

Index........................................... 241

Compléments

eBook [PDF]

Caractéristiques

Langue(s) : Français

Public(s) : Professionnels, Etudiants, Recherche

Editeur : EDP Sciences

Collection : Hors Collection

Publication : 2 octobre 2025

Référence eBook [PDF] : L38189

Référence Livre papier : L38172

EAN13 eBook [PDF] : 9782759838189

EAN13 Livre papier : 9782759838172

Intérieur : Couleur

Format (en mm) Livre papier : 160 x 240

Nombre de pages eBook [PDF] : 248

Nombre de pages Livre papier : 247

Taille(s) : 9,39 Mo (PDF)

--:-- / --:--