Informations pour les chercheurs / enseignants-chercheurs / étudiants

Accéder aux corpus numériques sous licence nationale


L’ensemble des établissements de droit français ayant mission d’enseignement supérieur et/ou de recherche, ainsi que les 5 écoles françaises à l’étranger bénéficient de l’accès aux corpus sous licence nationale à titre gratuit.

Afin que tout chercheur / enseignant-chercheur / étudiant membre d’un établissement bénéficiaire puisse accéder aux corpus numériques, l’établissement de rattachement doit avoir procédé au préalable à l’activation des accès aux corpus et à leur intégration les différents environnements numériques dédiés (portails documentaires, catalogues de bibliothèque…).

important : les demandes d’accès aux corpus sous licence nationale sont réalisées par les institutions bénéficiaires, à l’exclusion des particuliers. Pour toute information complémentaire :  s’adresser à la bibliothèque / structure documentaire de son établissement (organisme de recherche, université, grande école, CHU…).

Réutiliser les données pour l’enseignement ou la recherche


Les contrats d’acquisition des corpus sous licence nationale octroient aux utilisateurs autorisés des droits de réutilisation très larges, qui dépassent le cadre de l’exception pédagogique ou de recherche accordée par la loi. Ces dispositions rendent possibles des projets innovants d’exploitation de grandes masses de données.

En tant que chercheur, enseignant-chercheur ou étudiant membre d’un établissements bénéficiaire, il est possible de réutiliser les données des documents acquis sous licence nationale, ainsi que les grands ensembles de métadonnées, dans le cadre des activités d’enseignement et de recherche.

Focus sur les conditions de réutilisation

  • Représenter les données dans des supports pédagogiques, séminaires, ateliers, conférences
  • Intégrer les données, en citant la source, dans les travaux universitaires (thèses, mémoires…)
  • Mettre en ligne les travaux / documents intégrant les données récupérées
  • Enrichir les données par des contenus ou des liens
  • Effectuer des opérations de fouille de textes et de données (TDM) à partir des corpus de la plateforme ISTEX (environ 23 millions de documents en avril 2021)
  • Diffuser sous licence ouverte Creative Commons les résultats de recherche issus de l’exploitation des données disponibles sur la plateforme ISTEX (lexiques, ontologies, réseaux de connectivité lexicale, thématiques d’auteurs ou d’institutions…), à l’exclusion des textes
  • Diffuser sous licence ouverte Creative Commons les métadonnées de tous les documents ayant servi aux travaux de recherche
  • Mettre à disposition des utilisateurs ne relevant pas des établissements bénéficiaires, dans un but scientifique et non commercial, des extraits enrichis et annotés, dans certaines limites : 5% d’un titre (revue / ouvrage) et 15% d’un corpus d’éditeur

Journée ISTEX 2021 - focus sur la réutilisation des données de la plateforme