Accueil
/
Business Cases
/
Analyse de forums
Industrie pharmaceutique

Analyse de forums

Un acteur pharmaceutique avait besoin de comprendre les problématiques réelles des patients atteints du syndrome de Sjögren — pas celles des essais cliniques, celles que les patients expriment entre eux. Nous avons construit le système NLP capable d'extraire les tendances, les thématiques et les signaux faibles à partir de milliers de discussions de forums.

Problématique

Les forums médicaux contiennent ce qu'aucune étude clinique ne capture : la voix brute des patients. Leurs frustrations, leurs effets secondaires non rapportés, les traitements alternatifs qu'ils essaient, les questions qu'ils n'osent pas poser à leur médecin. Pour le client, cette information était une mine d'or stratégique, mais totalement inexploitable en l'état. Des centaines de milliers de messages, non structurés, rédigés en langage courant, sans aucun outil pour les collecter, les organiser et en extraire des tendances actionnables.

Vue rapprochée d’une coupe transversale colorée d’une géode montrant des couches concentriques de minéraux en jaune, marron, rouge et vert.

Solution

Ce que nous avons construit

Nous avons conçu un système complet de collecte et d'analyse NLP pour transformer des discussions de forum en insights stratégiques.

Étape 1 — Collecte automatisée. Scraping de 216 000 publications sur le forum sjogrensworld.org et insertion structurée dans une base MongoDB. Un pipeline de collecte conçu pour être reproductible sur d'autres sources.

Étape 2 — Analyse descriptive. Vue d'ensemble des données récoltées : volume de publications, taux d'engagement, liens entre posts, cartographie des utilisateurs les plus actifs et des dynamiques communautaires.

Étape 3 — Topic modeling et analyse de sentiment. Découverte automatique des thématiques propres aux patients via du topic modeling, couplé à une analyse de sentiment pour mesurer l'impact émotionnel de chaque sujet. Identification et dissection des tendances actuelles et passées.

Étape 4 — Extraction de connaissances latentes. Utilisation de techniques de word embeddings pour détecter des signaux faibles : problématiques émergentes, associations médicament-effet secondaire non documentées, évolutions de perception des traitements.

Projets dans la même catégorie