Blog

Twitter autorise la récupération de corpus de tweets et de leurs metadonnées à partir de son API. Des solutions permettent d'effectuer cette collecte, TCAT par exemple, un projet de Digital Methods Initiative. IramuteQ est un logiciel qui permet des analyses lexicales suivant la méthode Reinert (le même genre que Alceste), particulièrement intéressantes dans des cas de controverses. Comment formater les données que l'on vient de récupérer avec DMI-TCAT sur l'API de Twitter afin d'en faire l'analyse dans iRamuteQ ?
Dans IramuteQ, il existe un bouton pour importer des données venant de TCAT. Mais je ne l'ai jamais utilisé, je n'en parlerai donc pas ici. Dans ce post, on va aborder une manière simple, rapide et adaptable (donc sûrement améliorable aussi) de s'atteler à cette tâche. Il suffit de disposer d'une installation fonctionnelle de R (qui est forcément déjà installé pour iRamuteQ) et des outils fournis par le Tidyverse. Cette méthode est, bien entendu, garantie 100% à base de code opensource.

Continuer la lecture...

Je me lance dans la rédaction de ce dossier, parce qu'il devient nécessaire que je puisse fournir un document synthétique concernant les logiciels et l'équipement nécessaire à la transcription de pistes audio, que ces dernières soient des archives historiques, des interviews de journalistes, des entretiens de socio/ethnographes, etc. Cette nécessité trouve son origine dans une situation qui m'apparaît s'amplifier au fur-et-à-mesure des années : des personnes se lancent dans l'enregistrement d'entretiens sans savoir comment les traiter ensuite. Étudiant·es qui n'ont pas suivi de formation initiale en méthodologie des sciences sociales, ou des journalistes qui ne sont pas forcément passé·es par les écoles appellent ou lancent des bouteilles à la mer dans twitter pour savoir "quel est le logiciel qui, rapidement, pourrait mâcher largement le travail de transcription d'entretiens qui doivent être analysés avant le [insérer ici une date particulièrement imminente...]".

Continuer la lecture...

Je poste ici un tout petit compte-rendu des idées qui me sont venues à la suite des journées d'études sur les questions de genre et la fouille de données, organisée par Aurélie Olivesi du laboratoire ELICO à Lyon en novembre 2014. Tout devrait être certainement mieux référencé, plus réfléchi, mais, je n'ai pas l'énergie de le faire maintenant, j'ai déjà suffisamment de chapitres à rédiger comme cela ;-) [#teamrédaction]. Pour le coup, je ne me lance pas du tout dans un compte-rendu exhaustif, qui présenterait l'ensemble des travaux, mais vais plutôt lister les questions qui me restent en tête quelques mois plus tard (laissant alors dans l'ombre certains travaux tout à fait intéressants par ailleurs). Donc, précisions faites, qu'ai-je bien pu observer, depuis le fond de la salle, sur ce qui se disait, et sur qui disait quoi ?

Continuer la lecture...


Creative Commons License