L'année dernière, j'ai tenté de raconter combien la pratique des dits puzzles m'avait aidé à construire un plan de thèse. Ces puzzles demandent d'ordonner des éléments petit à petit, et de cerner l'ensemble d'un processus de linéarisation pour aboutir. Dans ce post, j'aimerais réfléchir à un second ensemble de pratiques qui a joué un rôle important pour moi dans l'intégration des processus de linéarisation propres au travail d'enquête et à la production d'un discours scientifique. La linéarisation repose cette fois-ci sur l'écriture du code informatique, d'abord pour linéariser le traitement des données en SHS, mais aussi pour linéariser le raisonnement qui en supporte l'analyse et, surtout, la présentation finale de celle-ci.
J'ai toujours aimé les puzzles, les trucs qui sont dans le désordre et qu'il faut ordonner, ou les trucs qu'il faut compléter, équilibrer, distribuer, etc. Les puzzles sont avant tout un espace de pratiques méditative, récréative, relaxante, focalisante, bref, ils font travailler l'esprit et lui permettent de découvrir certains mécanismes logiques et cognitifs, sans constituer toutefois un travail en eux-mêmes. je n'ai jamais eu la sensation qu'en jouant à ces jeux j'étais en train de m'exercer à une logique propre à l'écriture scientifique elle-même. Cette sensation, je ne l'ai perçue qu'au contact des puzzles de Simon Tatham, au moment où je refaisais une dernière fois un plan de thèse avant de me lancer dans l'écriture (oui, j'en ai fait un certain nombre, de plans de thèses).
Twitter autorise la récupération de corpus de tweets et de leurs metadonnées à partir de son API. Des solutions permettent d'effectuer cette collecte, TCAT par exemple, un projet de Digital Methods Initiative. IramuteQ est un logiciel qui permet des analyses lexicales suivant la méthode Reinert (le même genre que Alceste), particulièrement intéressantes dans des cas de controverses. Comment formater les données que l'on vient de récupérer avec DMI-TCAT sur l'API de Twitter afin d'en faire l'analyse dans iRamuteQ ?
Dans IramuteQ, il existe un bouton pour importer des données venant de TCAT. Mais je ne l'ai jamais utilisé, je n'en parlerai donc pas ici. Dans ce post, on va aborder une manière simple, rapide et adaptable (donc sûrement améliorable aussi) de s'atteler à cette tâche. Il suffit de disposer d'une installation fonctionnelle de R (qui est forcément déjà installé pour iRamuteQ) et des outils fournis par le Tidyverse. Cette méthode est, bien entendu, garantie 100% à base de code opensource.
Je me lance dans la rédaction de ce dossier, parce qu'il devient nécessaire que je puisse fournir un document synthétique concernant les logiciels et l'équipement nécessaire à la transcription de pistes audio, que ces dernières soient des archives historiques, des interviews de journalistes, des entretiens de socio/ethnographes, etc. Cette nécessité trouve son origine dans une situation qui m'apparaît s'amplifier au fur-et-à-mesure des années : des personnes se lancent dans l'enregistrement d'entretiens sans savoir comment les traiter ensuite. Étudiant·es qui n'ont pas suivi de formation initiale en méthodologie des sciences sociales, ou des journalistes qui ne sont pas forcément passé·es par les écoles appellent ou lancent des bouteilles à la mer dans twitter pour savoir "quel est le logiciel qui, rapidement, pourrait mâcher largement le travail de transcription d'entretiens qui doivent être analysés avant le [insérer ici une date particulièrement imminente...]".
Dans ce post, on trouvera l'histoire et les images à imprimer du mème de @moossye "open all the black boxes"
Dans un post précédent,j'ai raconté rapidement comment j'avais construit le questionnaire webINTIM. Ici, j'entre un peu plus dans les détails, notamment ceux qui concernent le choix difficile des catégories et des formulations. En effet, l'une des conditions de retour du questionnaire consiste avant tout à ce qu'il ait été lisible par un grand nombre de personnes aux cultures sexuelles au mieux différentes, mais parfois aussi en conflits, et il est très loin d'être simple de choisir les bons mots. C'est d'ailleurs dans ce genre de situation que l'on comprend combien les cultures sexuelles produisent des univers lexicaux très (très) différents.
Voici un post destiné à être probablement updaté régulièrement durant les prochaines semaines, puisqu'il s'agit d'y organiser une sorte de F.A.Q. du questionnaire webINTIM portant sur les usages amoureux, affectifs et/ou sexuels du web (principalement 2.0) et remplissable sur sociographie.fr. En effet, après avoir mis en ligne le questionnaire en fin de semaine dernière, j'ai reçu des questions variées, dont quelques unes étaient récurrentes, et parmi ces dernières, certaines inquiètes ou énervées. Ce qui est très intéressant dans ces retours c'est qu'ils discutent une partie des énoncés publiés dans le questionnaire, et interrogent tout autant la façon dont je les ai choisis, que, plus largement, ce qu'est un questionnaire, son caractère normatif, sa nature de dispositif technique, ses objectifs scientifiques, etc.
Je poste ici un tout petit compte-rendu des idées qui me sont venues à la suite des journées d'études sur les questions de genre et la fouille de données, organisée par Aurélie Olivesi du laboratoire ELICO à Lyon en novembre 2014. Tout devrait être certainement mieux référencé, plus réfléchi, mais, je n'ai pas l'énergie de le faire maintenant, j'ai déjà suffisamment de chapitres à rédiger comme cela ;-) [#teamrédaction]. Pour le coup, je ne me lance pas du tout dans un compte-rendu exhaustif, qui présenterait l'ensemble des travaux, mais vais plutôt lister les questions qui me restent en tête quelques mois plus tard (laissant alors dans l'ombre certains travaux tout à fait intéressants par ailleurs). Donc, précisions faites, qu'ai-je bien pu observer, depuis le fond de la salle, sur ce qui se disait, et sur qui disait quoi ?
Avec Mélanie Gourarier et Marc Parmentier, nous avons été invités par Martin Quenehen à partager l'antenne de Grantanfi. Il nous a réunis pour évoquer ce que la recherche universitaire pouvait bien faire lorsqu'elle s'intéressait à la séduction ainsi qu'aux rencontres amoureuses et sexuelles, pour le coup, à leur intégration dans les usages du web.
Nous voici au premier jour du congrès de l'afs, qui est le rassemblement probablement le plus important, avec l'aislf, de sociologues français et/ou francophones. Tout le monde arrive petit à petit, puis cours derrière son programme, sa chambre d'hotel, ses tickets de bus, etc. Les participants sont gentiment accueillis, ils savent ce qu'ils doivent chercher et demander, les personnes chargées de l'organisation du congrès savent ce qu'elles doivent indiquer et répondre. Les informations techniques et d'organisations sont-elles les seules informations à devoir circuler de façon globale (entendu ici transversalement aux RT et GT et réseaux personnels) dans ce type de congrès ? Qu'en dit-on sur twitter ?