Avez-vous utilisé l’internet aujourd’hui ? Vous avez visité Facebook ? Acheter sur Amazon ? Consulter la météo sur votre smartphone ? Regarder une vidéo sur YouTube ? Utilisé Uber ? Vous connecter sur LinkedIn ? Envoyer des SMS à vos collègues ? Si vous avez fait l’une de ces activités, vous avez généré des données. Et vous n’êtes que l’un des milliards qui génèrent également des données. En fait, les internautes génèrent aujourd’hui 2,5 quintillions d’octets de données chaque jour, et 90 % des données dont nous disposons aujourd’hui ont été générées au cours des deux dernières années seulement.
Pour les entreprises et les organisations qui peuvent apprendre et bénéficier de ces données, cette croissance explosive semble être un rêve devenu réalité. Mais ces données n’ont aucun sens si elles ne sont pas saisies et analysées, ce qui explique la forte demande de professionnels de la data science.
Un data scientist est un expert en statistiques, en data science, en Big Data, en programmation R, en Python et en SAS, et une carrière de data scientist promet de nombreuses opportunités et des salaires élevés. Le Harvard Business Review a déclaré que la data science est le métier le plus sexy du 21ème siècle. Glassdoor a désigné le data scientist comme le premier emploi aux États-Unis, avec un score de 4,8 sur 5 et un taux de satisfaction de 4,2 sur 5. Le salaire de base médian est de 110 000 dollars et il y a des milliers d’emplois non pourvus en ce moment, et beaucoup d’autres à venir : IBM prévoit que la demande de scientifiques spécialisés dans les données augmentera de 28 % d’ici 2020.
Le potentiel de carrière semble certainement prometteur, mais vous vous demandez peut-être ce que fait exactement un scientifique des données toute la journée ? Pour vous aider à comprendre les tâches quotidiennes d’un data scientist afin que vous puissiez vous imaginer dans ce rôle et décider s’il est temps de vous former pour cela, nous avons rassemblé quelques informations pour vous.
Sommaire
Il n’y a pas de journée type
Tout d’abord, nous devons commencer par une clause de non-responsabilité. Demandez à quelqu’un qui travaille comme informaticien de vous parler de sa journée typique et il se peut qu’il rie à gorge déployée de la notion de « typique ». Si vous êtes quelqu’un de flexible et d’adaptable, si vous aimez la variété dans votre journée de travail, alors la journée atypique d’un data scientist devrait vous convenir parfaitement. Et, bien que ces journées de travail soient pleines de flux, certains aspects de la journée restent les mêmes : travailler avec des données, travailler avec des personnes, et travailler pour rester en phase avec le terrain.
Travailler avec des données, des données partout
Les tâches quotidiennes d’un data scientist tournent autour des données, ce qui n’est pas surprenant vu le titre du poste. Les spécialistes des données passent une grande partie de leur temps à rassembler des données, à les examiner, à les mettre en forme, mais de différentes manières et pour différentes raisons. Parmi les tâches liées aux données auxquelles un data scientist peut s’atteler, on peut citer
- Extraction des données
- Fusion des données
- Analyser les données
- A la recherche de modèles ou de tendances
- Utiliser une grande variété d’outils, notamment R, Tableau, Python, Matlab, Hive,
- Impala, PySpark, Excel, Hadoop, SQL et/ou SAS
- Développer et tester de nouveaux algorithmes
- Tenter de simplifier les problèmes de données
- Développer des modèles prédictifs
- Visualisation des données de construction
- Rédiger des résultats à partager avec d’autres
- Rassembler des preuves de concepts
Toutes ces tâches sont cependant secondaires par rapport au rôle réel d’un scientifique des données : Les spécialistes des données sont avant tout des résolveurs de problèmes. Travailler avec ces données signifie également comprendre l’objectif. Il doit également chercher à déterminer les questions qui nécessitent des réponses, puis proposer différentes approches pour tenter de résoudre le problème.
Communiquer avec un large éventail de parties prenantes
Même les réunions tourneront autour des données, car vous cherchez à comprendre les problèmes, ce qui nous amène à une autre partie de la journée d’un informaticien atypique : la communication avec d’autres personnes qui ne sont pas des experts en données. Cela peut sembler jouer un rôle mineur dans la journée d’un data scientist, mais c’est tout le contraire qui est vrai car, en fin de compte, votre travail consiste à résoudre des problèmes, pas à construire des modèles.
Il est important de se rappeler que même si un data scientist travaille avec des données et des chiffres, la raison qui le motive est un besoin de l’entreprise. Il est essentiel d’être capable de voir la situation dans son ensemble du point de vue d’un service. Il en va de même pour la capacité à comprendre la stratégie qui sous-tend le besoin, et à aider les gens à comprendre les implications de leurs décisions.
Un informaticien passe du temps dans des réunions et répond à des courriels, comme le font la plupart des gens dans le monde de l’entreprise. Mais la capacité à communiquer est peut-être encore plus importante pour un data scientist. Au cours de ces réunions et de ces courriers électroniques, vous devez être capable d’expliquer la science qui se cache derrière les données d’une manière qu’un profane peut comprendre, ainsi que d’être capable de comprendre leurs problèmes tels qu’ils les voient, et non tels qu’un spécialiste des données les voit.
Se tenir au courant des changements
Le travail avec les données et le travail avec les autres occuperont une grande partie de votre journée, si vous décidez de faire carrière dans le domaine des data scientist. Le reste de votre journée sera consacré à vous tenir au courant de l’évolution du domaine des data sciences. De nouvelles informations apparaissent chaque jour, à mesure que d’autres spécialistes des données trouvent un moyen de résoudre un problème, puis partagent leurs nouvelles connaissances. Un data scientist passe donc généralement une partie de la journée à lire des blogs, des bulletins d’information et des forums de discussion liés à l’industrie. Il peut assister à des conférences ou se mettre en réseau en ligne avec d’autres scientifiques. Et de temps en temps, ils peuvent être amenés à partager de nouvelles informations.
En tant que data scientist, vous ne voulez pas perdre de temps à réinventer la roue. Si quelqu’un d’autre a une meilleure façon de résoudre un problème, vous voulez le savoir. La seule façon d’y parvenir est de suivre le rythme du changement.