logo BDSP

Offres d'emploi


  1. Identification de profils de détresse liée au diabète et développement d’un modèle de prédiction à partir de données textuelles du réseau social Twitter

    Stage. Val de Marne. Publié le 07/11/2017.

    Employeur

    Contexte

    La détresse liée au diabète regroupe tous les sentiments (frustration, stress, anxiété, peur...) liés à la gestion du diabète au quotidien (la gestion de son alimentation, activité physique, ses traitements, les hypoglycémies, les complications...). Le projet “World Diabetes Distress Study” (WDDS) est un projet de recherche international sur le diabète (de type 1 et de type 2) qui a pour but d’identifier des marqueurs de risque innovants de la détresse liée au diabète, d’une mauvaise qualité de vie et du risque de complications. Pour cela, le projet s’intéresse à l’analyse combinée, chez des individus diabétiques, de données cliniques et des données générées en ligne par un individu tout au long de sa vie (qu’on appelle le “digitosome”, à savoir les données par exemple issues des réseaux sociaux, d’applications smartphone, objets et dispositifs médicaux connectés). Le stage s’inscrit dans le cadre de l’un des sous-objectifs du projet qui est l’identification de profils de détresse liée au diabète puis le développement d’un modèle de prédiction de la détresse liée au diabète via des données textuelles issues de Twitter. Plus d’informations sur le projet WDDS ici (anglais).

    Coordonnées

    Gustave Roussy Inserm U1018 Equipe 9 – E3N

    114 rue Édouard Vaillant

    94805 Villejuif Cedex

    Description du poste

    Mission / Objectifs

    Le/la stagiaire devra prendre en charge

    1. Une revue rapide de la littérature sur :
    • les méthodologies de text mining pour classer des données textuelles Twitter (identification de profils psychologiques d’individus diabétiques)
    • les modèles de prédiction à tester (algorithmes de classification automatique de Tweets, méthodes machine learning type Naive Bayes et Support Vector Machine)(Doan et al. 2017), deep learning et réseaux de neurones pour classification de Tweets.
    1. L’analyse de classification de profils de détresse et ses déterminants ainsi que le développement de l’algorithme de prédiction de la détresse sur une base de données de plus de 6 millions de Tweets liées au diabète (uniquement en anglais dans un premier temps).
    2. La rédaction d’un rapport scientifique et d’un article scientifique.

    Profil recherché : débutants acceptés

    Un profil Master 2 ou ingénieur dernière année en data science ou biostatistique serait adapté. Une bonne maîtrise du langage R ou Python est indispensable, ainsi que de l’anglais lu. La connaissance de TensorFlow est un plus. En outre, le candidat devra faire preuve d’autonomie, de rigueur, de professionnalisme et d’esprit d’équipe.

    Stage

    Entre février et avril 2018, pour une durée de 6 mois.

    Dans le cadre du projet WDDS, une poursuite en thèse (académique ou CIFRE) est envisageable.

    Contact(s)

    Guy Fagherazzi, chercheur en épidémiologie, PhD, HDR et responsable du projet WDDS

    Centre de recherche en Epidémiologie et Santé des Populations, Inserm U1018 (guy.fagherazzi@gustaveroussy.fr)

    Fichiers joints

    Modalités de candidature

    Merci d’envoyer CV + lettre de motivation à Guy Fagherazzi (guy.fagherazzi@gustaveroussy.fr) avec la référence WDDS-201801