Logo de la startup Big data : quelles opportunités pour les startups ?

Big data : quelles opportunités pour les startups ?

#blog Dernière mise à jour : 23/06/2022

Rendu possible grâce aux progrès de l’informatique, le big data constitue une nouvelle approche d’analyse statistique à très grande échelle. Le concept repose d’une part sur la collecte et le stockage d’un important volume de données, et d’autre part, sur l’analyse de l’ensemble de données grâce à des algorithmes très performants. L’intérêt pour les entreprises ?
Pouvoir recouper et exploiter ces données afin de développer leurs ventes et leurs bénéfices.

Le big data désigne « un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler […] Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore. »
(Source : https://www.lebigdata.fr/)

Quelques exemples concrets d’application :

Netflix analyse le comportement de ses utilisateurs pour créer des suggestions à la fin de chaque film visionné. Leur algorithme a en effet la capacité de proposer un programme bien précis à chaque utilisateur, en évaluant ses goûts. La majorité des programmes visionnés sur la plateforme le sont ainsi grâce à son système de recommandations ! Amazon utilise ce même genre d’outil pour suggérer d’autres produits à acheter dès que vous êtes en train de consulter une page.

Le secteur de l’énergie est aussi un grand utilisateur du big data. Pour exemple, le thermostat intelligent : depuis quelques années, plusieurs startups travaillent à la création d’un thermostat adapté à chaque maison. Ramenée à la population d’un pays, l’économie réalisée se chiffre rapidement en milliards d’euros. Le défi est de taille, car de nombreux paramètres et combinaisons entre les logements, les chauffages et les modes de vie doivent être pris en compte. Mais il n’est pas impossible à relever, grâce à l’analyse d’une multitude de foyers et de leur consommation avec le big data.

Comment caractériser le big data ?

En utilisant la règle des 3 V, ou bien celle des 4 V ou encore celle des 5 V…

Initialement, pour différencier les études « big data » des études statistiques traditionnelles, on s’appuyait sur 3 critères commençant par un V : Volume, Vélocité et Variété. Puis sont venus le 4e et le 5e V, ceux de la véracité et de la valeur.

Volume : L’objectif est de traiter un maximum de données. Plus la population étudiée est importante, plus le résultat sera pertinent. Il est difficile de définir une frontière permettant de dire que l’on fait du big data ou pas, mais les puristes disent qu’on en fait pas avec Excel…

Vélocité : Les données sont très vite créées et circulent très rapidement, elles doivent donc pouvoir être utilisées à mesure qu’elles sont collectées. Ce qui implique des calculs très lourds et le recours à des outils ultra performants.

Variété : Il s’agit de la multiplicité des formats de données créées, que le big data est aujourd’hui capable d’analyser. Plus il y aura de données exploitables sur les sujets étudiés, plus il y a de chances que les résultats soient intéressants et inattendus !

Véracité : Ce concept peut paraitre évident. Mais dans la réalité, lorsqu’on traite des données, il n’est pas certain qu’elles soient de qualité. Si vous collectez des informations concernant vos clients via un formulaire, et qu’après vérification, vous vous apercevez que 30% de vos clients n’ont pas répondu correctement, votre étude est bonne à jeter. D’ailleurs, c’est la préparation de la collecte des données qui nécessite le plus de temps dans les projets big data.

Valeur : Aussi importantes soient-elles, des données n’ont aucune valeur si elles ne sont pas correctement exploitées. Ce cinquième « V » est primordial et reposera notamment sur les compétences de celui ou celle qui les analysera.

Les atouts du big data pour les startups

Grâce à l’immense quantité de données produites aujourd’hui, notamment sur internet et via le développement rapide des objets connectés, le big data présente de nombreux atouts en termes de marketing. Il permet d’obtenir beaucoup plus d’informations sur les consommateurs et entreprises qu’autrefois. Des données qui, une fois collectées, croisées et analysées, donnent l’opportunité à toute startup de mieux comprendre le comportement de ses clients ou prospects et d’anticiper leurs besoins.

Beaucoup plus en amont, le big data peut vous être utile en BtoB pour trouver des clients, en ciblant plus précisément les entreprises pouvant répondre à vos critères. C’est ce que propose par exemple Manageo, qui dispose d’une base de plusieurs milliards d’informations sur les entreprises françaises.

Le big data a aussi fait ses preuves en termes de pricing pour accorder l’offre et la demande. Le meilleur exemple dans ce domaine est surement Uber, dont les prix s’ajustent selon l’évolution de la demande et des temps de trajet. Il est également de plus en plus utilisé pour permettre de détecter les mauvais payeurs et les fraudeurs. C’est ce qui a fait le succès de la startup américaine Palantir, créé par des anciens de Paypal.

Big data : notre boîte à outils

Pour faire du big data, il faut une grosse machine (voire plusieurs), beaucoup de données et du savoir-faire.

Pour les machines, on peut trouver son bonheur avec les offres cloud, ou sinon, on peut transformer son sous-sol en data center ;-). Concernant les logiciels, il y a des solutions payantes et des solutions open sources (gratuites), parmi lesquelles :

Hadoop / Map Reduce, un framework spécialement conçu pour faire du calcul distribué, Map Reduce pouvant être défini comme une méthodologie de gestion des calculs. Map Reduce a été développé afin de gérer les études de textes réalisés par Google pour construire son moteur de recherche.

Spark est un concurrent d’Hadoop qui se veut plus rapide.

MongoDB est un logiciel de base de données, optimisé pour gérer de très grandes quantités de données réparties sur plusieurs machines.

Tableau est un logiciel de data visualization. La promesse de Tableau est de réaliser des graphiques intuitifs afin que les utilisateurs ne perdent pas de vue les éléments pertinents issus des traitements des données.

Mais le plus important lorsqu’on veut mettre en place l’outil big data dans sa startup, c’est le savoir-faire et l’expertise mathématique pour traiter ces données et garantir des résultats pertinents. Sinon, vous pouvez aussi faire appel à des spécialistes proposant des solutions clefs en main :

ForePaas propose l’architecture nécessaire pour mettre en œuvre des calculs big data sans avoir à vous transformer en ingénieur en informatique.

CaptainDash met en place des solutions de visualisation de vos données pour votre entreprise.

En conclusion, il est quasiment certain que votre startup aura besoin du big data. La principale question sera de savoir si vous développerez cette compétence en interne en parallèle de votre produit, ou si vous sous-traiterez ce besoin à des spécialistes.

Cet article est sponsorisé :)