Event box

La constitution de corpus pour l’analyse textuelle

Préalable à toute analyse, la constitution de corpus recouvre un ensemble de tâches parmi lesquelles il s’agit ici de proposer un parcours accessible à toutes et à tous. Quels sont les problèmes les plus fréquents que présente l’extraction de textes et quels sont les moyens de les résoudre? Cet atelier offrira une introduction pratique à l’utilisation des expressions régulières (regex) dans Microsoft Word, ainsi qu’à OpenRefine, un logiciel libre spécialisé dans la manipulation de données tabulaires. On y apprendra à extraire d’un lot de fichiers au format PDF les textes qu’il contient, à les nettoyer et à les structurer dans Microsoft Word, à les verser et réunir dans OpenRefine au sein d’une table unique à deux dimensions, et à structurer la table ainsi obtenue. 

RSVP: https://www.mcgill.ca/centre-montreal/fr/ateliers-ladirec-hiver-2023

Date:
Thursday, January 26, 2023
Time:
2:00pm - 4:00pm
Presenter:
Yu Chen Shi et Julien Vallières-Gingras (McGill)
Categories:
Campus event

Event Organizer

Marcela Isuster

More events like this...