Le compte de Twitter de WeRateDogs
a gagné de plus en plus de popularité et compte aujourd'hui
9,3 millions d'abonnés, celle ci est du à leur professionalisme au niveau d'attribuer des notes aux chiens
et leur système de notes unique qui suppose que tout chien doit être noté à partir de 10/10.
Dans cette étude on s'interésse donc aux tweets qu'ils ont publié entre les années 2015 et 2017 afin de
sortir avec des réponses pour les questions suivantes:
Un premier réflexe indique que les chiens dans les tweets qui ont plus de likes devraient avoir les
meilleurs notes,
on étudie donc la correlation entre les deux variables pour les notes < 20 puisque les données des notes
> 20 sont très dispersé:
le coefficient de correlation entre les deux variables est 0.42 qui indique qu'il existe une relation linéaire un peu faible entre les deux variables. En effectuant le test de Pearson de correlation on conclut que la correlation entre les deux variables est statistiquement significative.
Il apparait que la distribution des likes des pupper et doggo sont incliné à gauche ce qui dit que la probabilité d'observer des valeurs très elevés est un peu faible par rapport aux autres valeurs.
D'après l'echantillon qu'on a on voit que la moyenne des likes des doggo est plus éleve que la moyenne des likes des pupper. Après avoir effectué un test statistique on obtient une p valeur < 0.05 ce qui favorise l'hypothèse que la moyenne des likes des doggo est bien superieur à la moyenne des likes des pupper.
Voici les histogrammes des distributions des likes des Golden retriever et Chihuahua :
D'après les echantillons qu'on a on remarque que la moyenne des likes des golden retriever est plus elevé que celle des chihuahua. Après avoir effectué un test statistique on s'apperçoit que cette observation est statistiquement significative.
Pour conclure cette étude voici donc brièvement les réponses aux questions qu'on s'est posé precedement:
A rappeler que dans cette étude la taille de notre de dataset était un peu limité et que les tweets date de l'année 2017, celle ci peut encore être amélioré en rassemblant plus de tweets.