Big data, analyse sociologique, Jean-Philippe Cointet, Sylvain Parasie, sciences sociales, lexicométrie, outil d'identification, classification linguistique, plateforme numérique, Facebook, Twitter, analyse de données, communication numérique, lemme, analyse inductive, Python, algorithme
L'article que nous avons choisi d'analyser, avec l'aimable aide de notre professeur dans la sélection de ce dernier, s'intitule : « Ce que le big data a fait à l'analyse sociologique des textes. » Ce dernier a été rédigé par Jean-Philippe Cointet ainsi que Sylvain Parasie et publié au sein de la Revue française de sociologie en 2018. Cet article est une méta-analyse dont la prétention n'est pas de juger de l'efficience ou même de la justesse d'outils d'analyse lexicométrique. Il est au contraire bien plus question d'offrir aux lecteurs et aux lectrices une interrogation sur l'usage d'un nouvel outil, dont la conception n'épouse pas originellement le domaine des sciences humaines et sociales, mais celui des statistiques, des mathématiques et de la physique.
[...] Le parallèle que l'on aura dressé statistiquement entre les votes lors de scrutins et le taux d'engagement au sein des différents réseaux officiels de l'UPR pourrait également nous renseigner sur la stratégie des acteurs et les modes de contestations qu'ils choisissent à l'aune de ces discours. Lorsque l'on est un sympathisant de l'UPR, quel regard porte-t-on sur ce qui est contraire à ce que Monsieur Asselineau analyse ? Comment perçoit-on sa propre activité sympathisante ou militante ? Ce sont les questions auxquelles nous chercherons à apporter une réponse par la constitution d'un réseau de sens mais aussi par la fonction d'énonciation comme acte social à part entière, notamment à travers la tentative d'identification de l'usage de la fonction performative du langage impliquant les locuteurs à s'exécuter une action qu'ils viennent d'énoncer. [...]
[...] Le poids des analyses et des données est à relativiser au regard de cette nécessité. Deux lemmes, pourtant identiques ne sont pas équivalents en sens mais dépendent également de leurs contextes de formulation. Cette interrogation contextuelle peut se joindre à une prise en compte de "l'extériorité aux textes". Il est ici question d'éviter de se reposer uniquement sur le matériel empirique afin de formuler des analyses. On joindra donc des recherches sur les éléments cités au sein du corpus, sur l'appartenance ou nom du locuteur à une "tribu" ou une communauté, sur sa pratique d'un métier, son lieu de résidence entre autres. [...]
[...] Tout d'abord, nous avons basé la construction de notre sujet avec l'idée que François Asselineau constituait un personnage dont le discours était le fruit d'une hybridation politique avec un relent complotiste menant à l'érection d'une vision totalisante et conative de l'actualité dans le but de se faire agenda setter au sein du paysage politique français, mais d'une manière proprement originale : en limitant ses passages au sein des organes de presse reconnus. S'est alors bâtie notre réflexion sur son usage du web comme moyen unique de communication et la manière dont ce choix pouvait accentuer par ses caractéristiques, l'engagement des utilisateurs. Dans ce cadre-là, une analyse de sentiments dont rendent compte Cointet et Parasie nous semble pertinente. [...]
[...] Néanmoins, ils nous permettront de dresser les portraits robots des dix commentaires les plus susceptibles d'être publiés. Bien-sûr, l'aspect figuratif du langage, de même que la réduction de cette analyse à la catégorie grammaticale des substantifs seront des freins, nous avons conscience de ces limites et c'est pourquoi nous comptons adopter cette contextualisation des commentaires publiés, notamment en tentant de connaître la récurrence des contributions d'un utilisateur, sa présence ainsi que sa participation sur d'autres plateformes comme Twitter ou Facebook. [...]
[...] Réglage et modification requérant des connaissances et une bonne appréhension des langages de programmation algorithmique telles que Python ou R. Un savoir qui pour l'instant n'est que peu transmis ou communiqué au sein des formations en sociologie ou en linguistique, ce qui est regrettable dans la mise en œuvre de ces outils, car posséder ces connaissances, c'est aussi orienter la collecte de données, laisser place à une liberté analytique et d'interprétation plus grandes en jouant de variables et en conservant la possibilité d'étudier plusieurs hypothèses. [...]
Source aux normes APA
Pour votre bibliographieLecture en ligne
avec notre liseuse dédiée !Contenu vérifié
par notre comité de lecture