Une journée dans la vie d'un data scientist

Le guide de carrière Data Scientist de BrainStation peut vous aider à faire les premiers pas vers une carrière lucrative en science des données. Lisez la suite pour un aperçu de la façon dont les Data Scientists passent leurs journées au travail.

Devenez Data Scientist

Parlez à un conseiller en formation pour en savoir plus sur la façon dont nos bootcamps et nos cours peuvent vous aider à devenir un Data Scientist.

En cliquant sur Soumettre, vous acceptez notre termes .



Soumettre

Impossible de soumettre ! Actualiser la page et réessayer ?

En savoir plus sur notre Bootcamp Data Science

Merci!

Nous serons en contact bientot.

Voir la page Data Science Bootcamp

Une journée dans la vie d'un data scientist

De toutes les disciplines examinées dans l'enquête sur les compétences numériques de Brainstation, la science des données peut englober le plus large éventail d'applications. Mais bien que la science des données existe depuis des décennies, elle n'a pris son envol que récemment. À mesure que la disponibilité des données s'est élargie, les entreprises ont réalisé à quel point la science des données peut être importante, déclare Briana Brownell, fondatrice et PDG de Pure Strategy, et scientifique des données depuis 13 ans. Chaque entreprise doit désormais se concentrer partiellement sur la technologie. Cette semaine, par exemple, McDonald's a payé environ 300 millions de dollars américains pour acquérir sa propre entreprise de mégadonnées.

Il n'est donc pas étonnant que la concurrence pour les Data Scientists soit incroyablement élevée. En seulement deux ans, la demande devrait augmenter de 28 %, ce qui équivaut à environ 2,7 millions de nouveaux emplois. C'est plus d'ouvertures que les nouveaux diplômés ne pourront combler, ce qui signifie que les travailleurs de la technologie dans d'autres domaines devront perfectionner leurs compétences et passer aux données pour répondre à cette demande.

En fait, notre enquête suggère que cela se produit déjà. Environ quatre professionnels des données sur cinq ont commencé leur carrière en faisant autre chose, et 65 % de tous les scientifiques des données travaillent sur le terrain depuis cinq ans ou moins. Cet afflux massif de nouveaux esprits a un effet à double tranchant, dit Brownell ; d'une part, il y a beaucoup de nouvelles idées qui arrivent, dit-elle. Quand je regarde une partie du contenu provenant de la communauté de la science des données, je suis surpris de voir à quel point il y a de l'innovation. Le revers de la médaille, cependant, est une tendance à réinventer la roue.

La forte demande de Data Scientists est importante si vous en êtes un (ou envisagez de le devenir), mais pour les employeurs, le recrutement peut être un défi de taille. Ici, la reconversion est une solution évidente ; il peut être plus rentable de recycler un employé actuel en science des données que d'en recruter un nouveau.

Mais même si vous envisagez d'embaucher une nouvelle équipe de science des données, votre organisation dans son ensemble devra peut-être rafraîchir sa littératie en matière de données, prévient Brownell. Tout le monde veut travailler sur quelque chose qui a un impact sur son lieu de travail, qui améliore la vie des gens, dit-elle. Si la culture de votre entreprise n'est pas telle que [vos Data Scientists] peuvent avoir un impact, il est presque impossible d'embaucher. Le leadership doit être capable non seulement de communiquer aux recrues potentielles comment ils pourront contribuer, mais aussi de comprendre les propositions que leur équipe de science des données présentera éventuellement.

Malheureusement, dit Brownell, la majorité inconfortable sont les entreprises qui n'ont pas compris les choses. Notre enquête le confirme : la plupart des répondants (52 %) ​​ont décrit le niveau de littératie des données dans leurs organisations comme étant de base, suivi de la réponse la plus fréquente par la deuxième (31 %). Cela suggère qu'une formation fondamentale en science des données pourrait être utile à une grande majorité d'entreprises, en particulier en matière de leadership.

Ce besoin d'amélioration de la littératie des données - et de la communication - est renforcé par la façon dont la plupart des équipes de science des données sont structurées : en tant qu'équipe discrète, généralement composée de 10 personnes ou moins (selon 71 % des répondants), et souvent de cinq personnes ou moins (38 % ). Ces équipes soudées ne peuvent pas se permettre d'être isolées. Les personnes qui travaillent dans de grandes entreprises font généralement partie d'un petit groupe spécifique à la science des données, et leurs clients sont internes - d'autres parties de l'organisation, explique Brownell, c'est donc une équipe qui doit opérer dans de nombreux domaines différents de l'organisation.

Qu'est-ce que la science des données exactement ?

La perception commune (que les Data Scientists calculent les chiffres) n'est pas trop loin de la vérité, dit Brownell. De nombreux ensembles de données doivent révéler des informations, ce qui implique de nombreuses étapes telles que la création de modèles et le nettoyage des données, et même le simple fait de décider des données dont vous avez besoin. En fin de compte, cependant, cet effort est axé sur les objectifs : à la base, vous devez faire quelque chose avec les données.

D'ailleurs, les données ne sont pas toujours des chiffres. Alors qu'une majorité de répondants (73 %) ont indiqué qu'ils travaillaient avec des données numériques, 61 % ont déclaré qu'ils travaillaient également avec du texte, 44 % avec des données structurées, 13 % avec des images et 12 % avec des graphiques (et de petites minorités travaillent même avec de la vidéo et de l'audio). —6 % et 4 % respectivement). Ces résultats d'enquête suggèrent la façon dont la science des données s'étend bien au-delà des tableaux financiers, en enrôlant des personnes pour des projets tels que la maximisation de la satisfaction client ou la collecte d'informations précieuses à partir de la lance à incendie des médias sociaux.

En conséquence, il existe une énorme variété dans le domaine de la science des données, dit Brownell. Chaque industrie a sa propre opinion sur les types de données sur lesquelles les Data Scientists travaillent, les types de résultats qu'ils attendent et la manière dont cela s'intègre dans la structure de direction de leur entreprise. Dans tous les cas, cependant, l'objectif est de tirer parti des données pour aider une entreprise à prendre de meilleures décisions. Il peut s'agir d'améliorer les produits, de comprendre le marché dans lequel ils veulent entrer, de fidéliser plus de clients, de comprendre leur utilisation de la main-d'œuvre, de comprendre comment faire de bonnes embauches - toutes sortes de choses différentes.

Emplois en science des données

Dans certains domaines de la technologie, devenir un généraliste peut être votre meilleur pied dans la porte, ce qui n'est pas le cas avec la science des données. Les employeurs recherchent généralement des compétences spécialisées dans leur secteur. Parce que la science des données se décline en tant de saveurs différentes, notre enquête a sondé plus en profondeur, en examinant cinq catégories d'emploi principales : analyste de données, chercheur, analyste commercial, responsable des données et de l'analyse et scientifique des données proprement dit.

Dans tous ces intitulés de poste, la gestion et le nettoyage des données occupent la majeure partie de leur temps, mais à quelle fin ? Le plus souvent, l'objectif est d'optimiser une plate-forme, un produit ou un système existant (45 %) ou d'en développer de nouveaux (42 %). En creusant plus profondément, nous avons constaté que l'optimisation des solutions existantes a tendance à incomber aux analystes commerciaux et aux analystes de données, tandis que le développement de nouvelles solutions incombe plus souvent aux scientifiques des données et aux chercheurs.

Les techniques utilisées par les Data Scientists varient également selon les spécialisations. La régression linéaire était un outil commun à toutes les catégories, cité par 54 % des répondants, mais il y a eu quelques surprises lorsque nous avons examiné les logiciels que les gens utilisent.

Excel, ce cheval de bataille de la manipulation d'ensembles de données, est pratiquement omniprésent, cité par 81 % de tous les répondants, et l'outil le plus populaire dans toutes les catégories, à l'exception des scientifiques des données proprement dits (qui s'appuient le plus souvent sur Python, et ont également cité une boîte à outils plus large que les autres catégories. ). Qu'est-ce qui rend Excel si incontournable, même en 2019 ?

Ce que j'aime avec Excel, c'est la façon dont il vous permet de voir les données et d'en avoir une idée intuitive, a expliqué Brownell. Nous utilisons également beaucoup de Python, et dans ce cas, lorsque vous effectuez des analyses sur un fichier de données, celui-ci est masqué ; à moins que vous ne programmiez spécifiquement une partie de votre code pour visualiser les données brutes que vous analysez, vous ne les voyez pas. Alors qu'avec Excel, c'est juste devant vous. Cela a beaucoup d'avantages. Parfois, vous pouvez détecter des problèmes avec le fichier de données. Je ne vois jamais Excel disparaître de l'analyse.

Cela dit, il existe encore une longue liste d'autres programmes utilisés sur le terrain, ce qui n'est pas surprenant compte tenu de sa diversité. SQL (43 %) et Python (26 %) sont les plus populaires, avec Tableau (23 %), R (16 %), Jupyter Notebooks (14 %) et une poignée d'autres enregistrant des chiffres significatifs, sans parler de l'énorme 32% des répondants qui ont cité d'autres outils, même compte tenu de cette liste déjà longue.

Quel est l'avenir de la science des données ?

Enfin, nous avons demandé quelles tendances façonneront le paysage numérique au cours des cinq à dix prochaines années. L'apprentissage automatique et l'IA, qui ont tous deux des applications dans le domaine de la science des données, sont en très grande majorité les développements que les répondants s'attendent à avoir le plus grand impact, à 80 % et 79 % respectivement. Ceci malgré le fait que moins d'un quart (23%) d'entre eux travaillent actuellement avec l'IA.

L'intelligence artificielle peut absolument transformer la science des données, confirme Brownell, dont la société développe des produits d'IA. C'est vraiment la gloire des méthodes d'apprentissage non supervisées. Nous n'avons que peu de temps pour examiner ces ensembles de données, et surtout avec les grands, il est très difficile de tout faire. Les outils d'IA peuvent aider à révéler quelque chose que vous n'auriez peut-être pas pensé à rechercher. Nous avons certainement eu cela.

D'autres tendances que les Data Scientists s'attendent à dominer dans un avenir proche : l'Internet des objets (51 %), la blockchain (50 %) et le commerce électronique (36 %), la réalité augmentée et la réalité virtuelle (38 % et 27 %), et même la voix- basées sur des expériences (25 %) : toutes les manifestations importantes et tous les domaines où la science des données peut être mise à profit.

Kategori: Nouvelles