Quel algorithme pour suivre l’effet de buzz sur les réseaux sociaux ?

News’ Innov propose à ses utilisateurs une analyse de la couverture médiatique. Grâce aux différents graphiques de l’application, il est possible de suivre l’évolution de la popularité des sujets d’actualité.
Pour que cette analyse soit cohérente et intéressante, les données renseignées doivent être systématiquement à jour.

Certaines données peuvent évoluer temporairement et différemment dans le temps selon les articles. Ne pouvant pas maîtriser cette évolution, quelle est la meilleure solution à adopter pour récupérer efficacement les nouvelles valeurs de ces données?

Exemple : le cas des indicateurs sociaux d‘un article web médiatique.

 

Ne pas rater le Buzz !

La récupération des valeurs de ces indicateurs se fait en interrogeant les différents services web des réseaux sociaux et en renseignant le lien de la page web de l’article médiatique. News‘ Innov analyse une quantité de plus en plus importante d’articles chaque jour. La problématique se posant est de savoir à quelle fréquence doit-on récupérer les nouvelles valeurs des indicateurs sociaux de manière efficace sans se voir bloquer l’accès aux services web de Facebook, Twitter et Google+ ?

Généralement, dans les 10 minutes suivant la publication d’un article, il est possible de voir les valeurs des différents indicateurs sociaux Facebook, Twitter et Google+ augmenter, doubler ou bien même exploser en cas de buzz. Mais cette évolution, si importante soit-elle, est éphémère car 24 heures après la publication de l’article en question, les valeurs des indicateurs sociaux seront inchangées. L’intérêt sera porté sur un autre article.

Alors quelle est la meilleure solution à adopter pour récupérer efficacement ces valeurs ?

  • Une mise à jour à la demande ? Lorsque l’utilisateur accède à la page des graphiques, les données sont automatiquement mises à jour :

→ Cette solution n’est pas envisageable, si ces données sont utiles à d’autres rubriques comme le Top 10 de News’ Innov, cette mise à jour en entraînera d’autres pour les données liées afin de garder les statistiques cohérentes. La mise à jour à la demande prend donc de l’ampleur et nous risquons de prendre trop de temps pour afficher une information de statistique.

  • Envoi de requêtes de récupération de données à intervalle régulier constant ?

    • Ne souhaitant pas manquer la moindre augmentation, on interroge à intervalle très réduit ?

→ nombre important de requêtes inutiles, se voir bloquer l’accès au service web du réseau social dû à une sur-demande d’informations et saturer le serveur de production suite au nombre important d’articles concernés.

    • On évite la surcharge et on interroge à intervalle éloigné ?

→ nos données ne sont pas à jour et donc obsolètes

    • On interroge à intervalle raisonnable ?

→ nos données sont à jour mais on passe à côté des buzz !

  • On établit une hiérarchie entre les différents médias en fonction du mieux placé pour publier des articles pouvant faire le buzz et à chacun on leur définie une fréquence d’interrogation correspondante ?

→ Plutôt complexe et risqué comme stratégie, car un média peu connu peu faire l’exclusivité d’un article provoquant un buzz.

Nous vous proposons une solution qui laissera la chance à n’importe quel article de n’importe quel média d’avoir un rafraîchissement performant de ces données le plus proche possible d’un rafraîchissement en temps réel sans pour autant surcharger les services web des réseaux sociaux.

Idée générale : Pour savoir dans combien de temps il est intéressant de lancer le rafraîchissement des valeurs des indicateurs sociaux, nous allons utiliser nos précédentes valeurs enregistrées, plus précisément les trois dernières. A partir de ces trois valeurs on peut en déterminer une tendance et deviner la quatrième valeur selon des critères d’attente (dans combien de temps la valeur de l’indicateur social aura augmenté de 1? de 15? de 100? de 10% etc..).

Première étape : Initialisation

Nous ne possédons pas encore les valeurs des indicateurs sociaux d’un article venant d’être publié… pas le choix, on requête à un intervalle initial constant jusqu’à en atteindre trois. Ce sera nos trois premières coordonnées que l’on pourra placer sur un graphique avec en abscisse le temps de l’exécution de la requête et en ordonnée la valeur des indicateurs sociaux.

Deuxième étape : Déterminer la tendance d’augmentation des indicateurs sociaux

A partir de ces trois points, nous allons pouvoir déterminer une courbe de tendance et ainsi prédire la prochaine valeur.

Exemple : nous avons 3 points :

  • au bout de 5 minutes : 2 « j’aime » Facebook
  • au bout de 10 minutes : 5 « j’aime » Facebook
  • au bout de 15 minutes : 10 « j’aime » Facebook

Soit , on peut en déduire le système suivant :

→ Polynôme :   

Pour en déterminer le polynôme, plusieurs méthodes s’offrent à nous tel que le pivot de Gauss, le déterminant, interpolation lagrangienne etc…

A partir de ce polynôme on peut déterminer la prochaine valeur par exemple au bout de 20 minutes :    « j’aime » Facebook.

Troisième étape : calcul par la tangente à la courbe

La courbe de croissance des indicateurs sociaux est strictement croissante hors le polynôme que l’on déduit est une parabole et peut marquer des décroissances.

Pour éviter ce genre d’erreur, nous allons toujours nous baser sur la tangente à ce polynôme. Une fois cette courbe tracée, nous allons pouvoir déterminer graphiquement dans combien de temps notre article pourrait avoir enregistré 5 nouveaux « j’aime » Facebook :

Graphiquement, l’article devrait avoir enregistré 5 « j’aime » Facebook supplémentaires 4 minutes après le dernier enregistrement.

Pour trouver l’intervalle par le calcul : nous utilisons la méthode d’extrapolation par la tangente à la courbe.

Cette méthode est efficace car elle nous indique dans combien de temps il est intéressant de ré interroger le service web ce qui nous évite d’interroger inutilement. Ainsi la place laissée par les articles entraînant des interrogations inutiles permettent à d’autres articles plus populaires d’être interrogés plus fréquemment que d’autres. En outre, cette méthode s’adapte aux attentes et aux contraintes car nous pouvons faire varier les critères d’attente comme augmenter le nombre de “j’aime” Facebook attendus pour des fréquences d’interrogation plus éloignées ou dans le cas contraire le réduire pour une fréquence à intervalle plus court.

Qu’a-t-on gagné ?

Cette mise à jour performante des indicateurs permet à News ‘Innov :

  • d’afficher des données à jour,
  • de respecter les limites d’utilisation des services web des réseaux sociaux,
  • de diminuer le nombre important de requêtes inutiles aux bénéfices d’articles nécessitant une fréquence d’interrogation plus importante.

N’hésitez pas à en juger par vous même sur News’ Innov !

Ce sujet vous intéresse ?

NOUS CONTACTER