Collection Polaris

Fjord Scoresby (côte Est du Groenland)
Description de la collection
Cette collection thématique est dédiée à la région polaire Arctique. Elle se compose de corpus de documents en texte intégral issus de l’archive ISTEX.

L’objectif pluriel de cette collection répond aux besoins différents des équipes auxquelles elle est destinée.

Pour l’équipe Recherches Arctiques, le but était de réaliser une exploration thématique des corpus circonscrits aux zones polaire et subpolaire boréales, au moyen d’outils de fouille de textes et d’analyser l’évolution diachronique des thématiques identifiées. À cette fin, deux corpus ont été constitués : l’un contenant des documents actuels, l’autre des documents historiques, datant d’au moins 100 ans.

Pour l’équipe Scodex, il s’est agi de tester les outils et procédures à disposition pour constituer un corpus ainsi que pour l’explorer en fouille de textes :
  • performances de l’API ISTEX
  • opérateurs et syntaxes d’interrogation de l’API
  • outils d’extraction de corpus : fonction extract, moissonneur istex-api-harvester, moissonneur harvestCorpus
  • utilisation de sous-corpus en tant que corpus gold pour tester, à partir de ces références bibliographiques intégrées au logiciel Zotero, l’accès direct au texte intégral de ces documents dans ISTEX en utilisant le résolveur de liens OpenURL ISTEX
  • utilisabilité des procédures établies sur l’analyse thématique de corpus via des outils de TDM (Iramuteq, Topic Modeling Tool).
Liste des corpus
    Powered by Lodex 9.4.8