DEV Community

el houssine el malki
el houssine el malki

Posted on

Explorer le succès des applications payantes pour la famille sur Google Play : Une expérience scientifique

Introduction

Dans cette étude, nous considérons l’analyse des données comme une véritable expérience scientifique, où chaque étape — de l’hypothèse à l’expérimentation puis aux conclusions — est suivie méthodiquement. L’approche est inspirée d’articles de blogs techniques, comme ceux sur Kubernetes, qui structurent l’investigation de manière scientifique.

L’objectif principal de cette expérience est de comprendre comment le prix des applications influence leur popularité (mesurée par le nombre d’installations) et d’examiner quelles catégories ou types de jeux et applications (Genres) sont les plus prisés par les utilisateurs.

Hypothèse

Dans cette expérience, nous formulons l’hypothèse suivante :

Nous supposons que les applications payantes de la catégorie « Famille » dont le prix est élevé enregistrent moins d’installations que celles à prix plus bas, et que certaines catégories/types (Genres) sont plus populaires que d’autres.

Cette hypothèse servira de guide pour notre analyse des données et la validation de nos observations.

Données utilisées (Dataset)

Pour cette expérience, nous avons utilisé un jeu de données provenant de Google Play, contenant des informations détaillées sur différentes applications Android. Ce dataset est particulièrement adapté car il permet d’analyser à la fois le prix, le nombre d’installations et les catégories/types (Genres) des applications.

Description du dataset
Chaque ligne du dataset correspond à une application et les colonnes les plus importantes pour notre étude sont :
Category : la catégorie principale de l’application (par exemple FAMILY, ART_AND_DESIGN).
Genre : le type précis de l’application (par exemple Art & Design, Creativity).
Price : le prix de l’application (0 pour gratuit, >0 pour payant).
Installs : le nombre d’installations indiquant la popularité de l’application.

Pourquoi ce dataset ?

  1. Il contient suffisamment de données quantitatives (Prix, Installations) pour permettre des analyses statistiques fiables.
  2. Il offre une large variété de genres et catégories, ce qui est idéal pour étudier la popularité relative des différents types d’applications dans la catégorie « Famille ».
  3. Il permet de filtrer facilement les applications payantes et de tester notre hypothèse sur la relation entre prix et popularité.

Méthodologie (Étapes de l’expérience)

Pour tester notre hypothèse, nous avons suivi une approche structurée en quatre étapes principales :
🔹 Étape 1 : Nettoyage des données
Convertir les colonnes Price et Installs en valeurs numériques pour permettre les calculs statistiques.
Supprimer les lignes contenant des valeurs manquantes (NaN) afin d’assurer la fiabilité des analyses.
🔹 Étape 2 : Filtrage des données
Sélectionner uniquement les applications :
Payantes (Price > 0)
Appartenant à la catégorie Famille (Category = FAMILY)
🔹 Étape 3 : Analyse statistique
Calculer :
Le prix moyen par catégorie ou genre.
Le nombre total d’installations par genre.
Identifier les genres les plus populaires selon le nombre d’installations.

🔹 Étape 4 : Visualisation
Bar plot : pour représenter le prix moyen par catégorie ou genre.
Pie chart : pour montrer les genres les plus populaires en fonction du nombre d’installations.

Résultats

Après avoir appliqué notre méthodologie, nous avons obtenu plusieurs résultats intéressants à partir des visualisations :
🔹 Interprétation des graphiques
Bar plot du prix moyen par catégorie :
Le graphique montre que certaines catégories d’applications payantes pour la famille ont un prix moyen plus élevé, mais cela ne se traduit pas forcément par plus d’installations.

Pie chart des genres les plus populaires :
Certaines catégories ou genres dominent clairement en termes d’installations. Par exemple, les applications liées à l’éducation ou à la créativité attirent beaucoup plus d’utilisateurs que d’autres genres moins populaires.

🔹 Observations clés
Les genres populaires concentrent la majorité des installations, ce qui indique que les utilisateurs ont des préférences marquées pour certains types d’applications.
Un prix élevé ne garantit pas une popularité plus grande : certaines applications moins chères ou moyennement tarifées ont un nombre d’installations plus important que les applications les plus coûteuses.

Ces résultats confirment partiellement notre hypothèse : le prix influence la popularité, mais d’autres facteurs, comme le genre ou la pertinence pour les enfants, jouent également un rôle crucial.

Conclusion

Validation de l’hypothèse: **
Notre hypothèse est partiellement confirmée. En effet, le prix des applications payantes influence le nombre d’installations, mais ce n’est pas le seul facteur. Le genre de l’application et sa pertinence pour les enfants jouent un rôle tout aussi important.
**Leçons tirées de l’expérience :

Les genres populaires concentrent la majorité des installations.
Les applications moins chères ou à prix moyen peuvent parfois surpasser les applications les plus chères en termes de popularité.
L’analyse des données permet de comprendre les préférences des utilisateurs de manière précise et objective.
Importance pour la prise de décision commerciale:
Les résultats montrent que les développeurs et les responsables marketing peuvent adapter le prix et le type d’application pour maximiser l’adoption. L’analyse scientifique des données devient ainsi un outil stratégique pour le développement et la promotion des applications.

El houssine El malki
Ismail Chaibi

Top comments (0)