Logo de la startup Pourquoi faire du big data dans sa startup ?

Pourquoi faire du big data dans sa startup ?

#blog Dernière mise à jour : 08/03/2023

I – Introduction : Qu’est-ce que le big data ?

Le big data est une nouvelle discipline de l’informatique née avec les nouvelles avancées techniques, les nouvelles capacités de stockage et de calcul des ordinateurs.
Selon Wikipedia, “Le big data nécessite un ensemble de techniques et de technologies avec de nouvelles formes d’intégration pour révéler des informations à partir d’ensembles de données divers, complexes et d’une échelle massive.”
Pour faire simple, le big data consiste à mesurer le maximum de choses, et à les analyser ensemble afin d’obtenir de nouveaux résultats.

Autrement dit, le big data tourne autour de 3 éléments: Volume, Vitesse et Variété.

Volume

On ne parle pas de centaines de données mais de millions de données. La coutume est de dire que si ça tient sur une feuille excel, c’est pas du big data !
On parle ici de volume très important.
Dans certaines entreprises, la quantité d’informations à traiter est telle que cela justifie la création d’architecture hardware spécifique !

Vitesse

On est sur du Usain Bolt du traitement d’information. De préférence en temps réel, le traitement et l’analyse permettent une plus grande réactivité !
Cela semble “easy” mais en réalité l’enjeu technique est de taille.

Il faut ainsi:
1/ collecter la donnée,
2/ la stocker
3/ la traiter
4/ et restituer le résultat..
Le tout avec un temps de téléchargement digne d’un refresh de page web.
Le challenge est d’autant plus élevé que les données peuvent être variées. Imaginez vous dans l’industrie du transport où certaines entreprises traitent des milliers de coordonnées en direct comme par exemple Waze.

Variété

L’intérêt du big data est d’analyser une multitude de données en même temps pour identifier des améliorations ou des opportunités business ! Et de prier pour trouver une causalité à la 1ere corrélation venue. (Corrélation ? Causalité? Je te perds sur les termes? allez on est sympa on t’a fait un pense-bête)
Un exemple – mais peut-être un mythe, on a pas réussi à éclaircir le point – saviez-vous que les couches étaient intentionnellement mises à proximité des packs de bière dans certains supermarchés ?
L’histoire raconte qu’une grande marque de supermarché américain a lancé une étude big data sur ses consommateurs et leur panier.
Millions de données, autant que de passage caisse et si en plus on rajoute les programmes fidélité dedans..Bref, ils ont regardé leurs chiffres et …une tendance a émergé ! Des paniers constitués uniquement de couches et de pack de bière.
L’analyse a permis de remonter que les hommes, nouvellement papa, se rendaient au supermarché pour acheter des couches. Sympa les darons.Mais, une fois sur place, l’appel de la bière se faisait entendre et ils en profitaient pour acheter un pack de bière.
La marque de supermarché, très philanthrope et voulant répondre à un besoin client certain, a donc décidé de faciliter la tâche et à placer les bières à côté des couches. L’histoire ne nous dit pas si le CA ou la fidélisation a augmenté mais bon… vous n’allez plus faire les courses de la même façon !

II – Pourquoi ma startup devrait faire du big data ?

Big data, c’est pour les grosses entreprises? Que nenni. L’avantage de l’implémentation d’une solution big data au sein de votre entreprise est qu’il permet de “tout connecter”. Cela va vous permettre de prendre conscience des éléments à corriger et faire apparaître les opportunités ! Cette donnée holistique permet l’apparition des corrélations et facilite de facto, la détection de nouvelles causalités :)

Les principaux bénéfices constatés sont typiquement :

A : une optimisation de la performance marketing

En associant les données clients et les données de performances de vos efforts marketing, vous pourrez dégager des tendances structurantes ainsi que des insights. Vous allez par conséquent pouvoir améliorer votre ciblage prospects/clients mais aussi la performance globale de vos campagnes/ventes.

Le meilleur exemple à nos yeux reste Amazon.
Ce géant de la data opère une segmentation client hors norme afin de proposer des produits supplémentaires ! Rappelez-vous, cette petite catégorie “Produits fréquemment achetés ensemble” qui vous tente comme un diable.
Tout ceci est en fait le résultat d’algorithmes de big data !

A bis : Une meilleure connaissance client

En connectant de multiples sources de données tout le long de votre parcours clients, vous permettra de mieux cerner votre client. Identifier les points froids/de perdition et mettre en place une meilleure stratégie de rétention client.

Voici un exemple concret avec un algorithme de Support Vector Machine :
A gauche sont représentées des données sur un axe X,Y. Et à droite, avec le SVM, on peut constater qu’il y a un bien deux groupes distincts selon un troisième axe. Si on imagine qu’il s’agit de données clients, cela permet de traiter chaque groupes de manières plus fine.
illustration tirée de https://www.eric-kim.net/eric-kim-net/posts/1/kernel_trick.html

Pour information, des outils comme Salesforce ou Visibrain analysent en temps réel les sentiments sur Twitter et peuvent vous faciliter votre prise de décisions.

B Les réductions de coûts “de fabrications”

Que vous soyez une startup ‘industrielle’ avec une chaîne de montage ou une fintech, en analysant vos données, il y a fort à parier que cela remette en question vos méthodes actuelles. Pas de panique, vos process seront optimisés sur des aspects inattendus.

Un exemple? Nike a optimisé l’empreinte carbone de ses chaussures grâce au big data. L’article sur le blog de Nike

C Amélioration produit / amélioration de la qualité

Tout comme vous allez pouvoir optimiser votre performance marketing, big data va vous permettre d’identifier des nouvelles actions/usages possibles sur vos produits/services.
Pour cela, il vous suffit d’analyser vos divers retours client collectés à travers internet dans votre framework de big data.

Bank of America a conçu un programme de fidélité BankAmeriDeals, suite à une vaste analyse des données clients. L’objectif initial était de diminuer le churn mais c’est carrément devenu un outil pour diminuer les impayés de ces clients …

III – Comment faire du big data

Attention, on rentre dans le dur !

A la théorie

En théorie, ce merveilleux pays, faire du big data se fait en 4 temps :
1/ collecter les données : ça peut se faire avec un thermomètre connecté, une API, un fichier txt mis à jour par vos collègues, qu’importe, il faut nourrir la bête.
2/ le stockage : c’est un le même principe que le disque dur de votre pc. Mais en plus gros. Beaucoup plus gros.
3/ L’analyse : Couteau suisse d’algorithmes et d’analyse de données, l’objectif est de faire passer une multitude de formules sur vos données pour en extraire de l’information.
4/ La restitution : Du joli classeur excel au rapport à l’UX travaillé, la bonne compréhension (et donc la bonne adoption par le reste de l’entreprise), la façon dont le résultat est présenté, est très important. Avec le big data, les comptes rendus font souvent intervenir plusieurs sujets en même temps. Le fait de présenter son rapport de manière claire et concise facilite la bonne compréhension.

B les outils existants

Tout comme il existe la suite office pour faire de la bureautique, il existe des ensemble d’outils pour faire du big data dans son entreprise. En général, ces entreprises disposent même d’équipes pour vous accompagner, y compris dans vos réflexions métiers et l’exploitation de vos résultats. Une véritable équipe de consultants !
Certains ont même des infrastructures hardware prêtes à être utilisées et répondent à tous vos besoins big data. Un genre de ‘Big Data as a Service’ !
C’est le cas de BlackTiger, startup franco-Belge qui a développé sa propre plateforme de gestion de la donnée et met à disposition de ses clients son savoir-faire et ses équipes.

C les outils open source

A l’inverse des solutions “All in one” comme Black Tiger, les solutions open-source sont spécialisées sur une tâche précise.
Par ailleurs, ces outils logiciels fonctionnent mieux sur des machines hardware ayant un coût non nul …

D’un point de vue langage de programmation, il y a python ou R.
Ensuite pour les frameworks, on part sur une installation MongoDB ou Hadoop.
Si vous êtes plutôt analyse BI, nous recommandons Metabase.
Pour la visualisation, par défaut Matplotlib, Grafana (s’il y a beaucoup de données). Sinon un petit template html avec graph.js fera largement l’affaire.

Voici les outils open sources les plus utilisés dans les projets Big Data :
https://github.com/newTendermint/awesome-bigdata

IV – Conclusion

On n’améliore pas ce qu’on ne mesure pas.
La mise en place du big data ne se cantonne pas à installer des logiciels et cliquer sur tous les boutons. Elle doit s’accompagner d’une véritable démarche de management afin que les équipes puissent tirer partie des résultats en convertissant les résultats mathématiques en actions bien concrètes !
Si vous souhaitez mettre en place une politique de big data dans votre entreprise, la 1ere question à vous poser sera : souhaitez-vous prendre en charge le coût global d’une telle infrastructure ou bien préférez-vous commencer par travailler avec un partenaire expert ?