Event box
La constitution de corpus pour l’analyse textuelle
Préalable à toute analyse, la constitution de corpus recouvre un ensemble de tâches parmi lesquelles il s’agit ici de proposer un parcours accessible à toutes et à tous. Quels sont les problèmes les plus fréquents que présente l’extraction de textes et quels sont les moyens de les résoudre? Cet atelier offrira une introduction pratique à l’utilisation des expressions régulières (regex) dans Microsoft Word, ainsi qu’à OpenRefine, un logiciel libre spécialisé dans la manipulation de données tabulaires. On y apprendra à extraire d’un lot de fichiers au format PDF les textes qu’il contient, à les nettoyer et à les structurer dans Microsoft Word, à les verser et réunir dans OpenRefine au sein d’une table unique à deux dimensions, et à structurer la table ainsi obtenue.
RSVP: https://www.mcgill.ca/centre-montreal/fr/ateliers-ladirec-hiver-2023
- Date:
- Thursday, January 26, 2023
- Time:
- 2:00pm - 4:00pm
- Presenter:
- Yu Chen Shi et Julien Vallières-Gingras (McGill)
- Categories:
- Campus event