L’approche interdisciplinaire de ce projet est fondamentale pour son innovation. Elle implique l’intégration synergique des méthodes, des théories et des pratiques de diverses disciplines - en l’occurrence, les sciences biomédicales, les sciences informatiques et les sciences du langage - pour aborder les problématiques spécifiques liés à la santé mentale dans les communautés linguistiques minoritaires.
Cette démarche permet de transcender les limites des disciplines individuelles, favorisant la création de solutions novatrices qui seraient inatteignables dans un cadre disciplinaire.
Nous allons choisir plusieurs langues distinctes, en tenant compte de leur diversité linguistique et géographique, pour assurer une représentativité la plus large possible : langues sémitiques (arabe, hébreu), langues latines (italien, espagnol), langues germaniques (allemand), langues slaves (ukrainien), langues asiatiques (chinois, japonais, coréen), etc.
Nous allons utiliser des sources variées comme des forums de discussion publics, des blogs spécialisés en santé mentale, des transcriptions d’entretiens télévisés ou de témoignages particuliers, ainsi que des sites web de référence en santé mentale pour chaque langue minoritaire.
Nous allons analyser et annoter le corpus pour des tâches spécifiques telles que la segmentation des phrases, l’analyse des processus cognitifs et l'extraction des marqueurs psycholinguistiques pour faciliter son utilisation dans le traitement automatique du langage naturel.
Le développement de petits modèles de langage adaptés aux langues minoritaires et sensibles aux particularités culturelles représente la phase technologique du projet.
Ces petits modèles de langage seront conçus et entraînés pour analyser les marqueurs de difficultés de santé mentale dans les corpus linguistiques collectés dans chaque langue minoritaire.
Ils utiliseront des techniques avancées de traitement automatique du langage naturel et d’apprentissage automatique en intelligence artificielle, notamment pour le traitement de la similarité linguistique et des entités nommées associées à différents états de santé mentale.
Par manque de moyens et de ressources, l'essentiel du développement en intelligence artificielle est mené dans les langues dominantes, à l'échelle nationale ou internationale. Le projet MINOR-IA peut jouer un rôle dans le soutien et la revitalisation des langues minoritaires, notamment en développant des modèles de langage spécialement conçus pour les langues minoritaires. Cela peut aider à réduire le fossé technologique et à autonomiser les locuteurs et les professionnels issus de ces langues.
Ce soutien peut passer également par l'amélioration des modèles de langage existants.
En utilisant des techniques de transfert d'apprentissage, il est possible d'optimiser ces modèles en intégrant des données spécifiques aux langues minoritaires.
Cela peut être particulièrement utile pour la traduction, la documentation et la préservation de ces langues, notamment en créant des archives numériques.
Enfin, l'utilisation de techniques de traitement automatique du langage naturel (TALN), d'analyse de textes et d'apprentissage machine pour analyser et comprendre la structure et la sémantique des langues minoritaires peut aider à développer des outils pédagogiques et des contenus éducatifs.
Cela ouvre la voie également à de nouveaux outils et modes de communication assistée par l'IA en faveur des communautés minoritaires.
We need your consent to load the translations
We use a third-party service to translate the website content that may collect data about your activity. Please review the details in the privacy policy and accept the service to view the translations.