Rechercher dans ce blog

mardi 25 février 2014

Laïcité : de quoi es-tu le nom sur les blogs français en 2013-2014 ?

Pour boucler la boucle sur les thématiques-valeurs de la République française , je me suis penché sur les références sémantiques que les blogueurs français associent à la "laïcité" dans leurs prises de parole sur le Web. Pour ce faire, un corpus pertinent et représentatif a été constitué grâce à Google BlogSearch. 

De l'analyse text-mining de ce corpus centré sur le mot-requête "laïcité" nous a avons retenu les 15 références associées les plus saillantes représentées sur le graphique ci-après :

mardi 18 février 2014

Fraternité : comment s'énonces-tu dans les blogs français en 2013-2014 ?

"Fraternité", comment s'énonces-tu dans les blogs français en 2013-2014 ? Quelle configuration structurante de sens ?

Pour y répondre, à l'approchant comme toujours dans cet exercice, nous avons analysé le contenu sémantique d'un corpus pertinent de titres de billets de blogs français publiés en 2013-2014 centrés sur le mot-requête "fraternité". Merci à Google BlogSearch pour la récolte des données.

Le graphique ci-après présente le poids relatif des 15 références thématiques les plus importantes qui structurent le corpus "Fraternité". Les taux ont été calculés en fonction du total des occurrences de l'ensemble des 15 références principales retenues.

lundi 17 février 2014

L'égalité : quelle configuration de sens dans les blogs français en 2013 - 2014 ?

Après l'article sur la "Liberté", voyons de quoi le mot "Egalité"  est le nom dans les publications des blogs français durant la période 2013 à nos jours.

Pour s'en faire une idée, toujours à l'approchant et grâce à Google BlogSearch, j'ai constitué un corpus pertinent de titres de publications autour du mot-requête "égalité", couvrant la période 2013 à nos jours. Puis, j'ai soumis ce corpus à une analyse sémantique fine assistée par ordinateur.

Le graphique ci-après présente le poids relatif des 15 références sémantiques les plus importantes, associées au mot-requête "égalité'" dans les titres des publications sur les blogs français. Les taux ont été calculés en fonction du total des occurrences de l'ensemble de ces 15 références ici retenues.

samedi 15 février 2014

Liberté : quelle configuration de sens dans les blogs français (2013-2014) ?

Quelle configuration de sens se dégage des titres des publications sur les blogs français (2013-2014) autour du mot "Liberté" ? 

Pour répondre à cette question j'ai analysé le contenu d'un corpus pertinent obtenu grâce à l'outil "Blogsearch" de Google.

De cette analyse, je ne présente ici que les 15 premières références sémantiques associées au mot "Liberté" dans les titres des publications. Le graphique ci-dessous présente le poids de chaque référence associée. Les taux sont calculés en fonction du total des occurrences de l'ensemble de ces 15 premières références dans le corpus "Liberté".

mardi 11 février 2014

Les internautes disent (re)chercher quoi dans les blogs et fora ?

Que disent (re)chercher les internautes  sur les blogs et fora français sur Internet ? Comment les références thématiques de ces dires ont évolué au cours de ces trois dernières années (2011, 2012 et 2013) ?

Pour répondre à ces questions, nous avons d'abord fait appel au moteur de recherche de blogs de Google pour constituer des corpus de textes autour des requêtes "je (re)cherche" et "nous (re)cherchons". Ensuite, l'analyse sémantique assistée par ordinateur de ces corpus nous a permis d'identifier les références thématiques associées.

Le graphique ci-après nous donne l'évolution des 15 références thématiques les plus importantes au cours de ces trois dernières années 2011, 2012 et 2013. Les taux d'occurrence de ces références ont été calculées en fonction de la fréquence d'occurrence de "Je" et "Nous" dans chaque corpus de texte : soit 3345 occurrences pour le "corpus 2011", 3247 occurrences pour le "corpus 2012" et 3178 occurrences pour le "corpus 2013".

jeudi 6 février 2014

Valls versus Taubira dans la presse française en ligne

Pour ce premier article de mon blog, je vous propose une analyse "text mining" de ce que la presse quotidienne nationale (PQN) française en ligne (une douzaine retenue) donne à voir de deux grandes figures politiques françaises : Manuel Valls (ministre de l'intérieur) et Christiane Taubira (ministre de la justice, garde des sceaux).

Grâce à Google, j'ai constitué, à l'approchant si j'ose dire, deux corpus de textes regroupant les titres d'articles de la PQN française en ligne centrés d'une part sur Manuel Valls et d'autre part sur Christiane Taubira. Ces corpus couvrent pour chacun les années 2012 et 2013, du moins ce que Google permet d'en obtenir et c'est déjà beaucoup.

Les graphiques ci-après présentent la répartition des taux d'occurrence de références thématiques significatives dans le "corpus Valls" et dans le "corpus Taubira".