L

Labs: Senior Data Scientist NLP/GenAI - Catalog

Labs: Senior Data Scientist NLP/GenAI - Catalog
Full-time
Remote
Worldwide

Headquarters: Remote - France
URL: http://mirakl.fr


Mirakl est le leader des solutions logicielles pour le e-commerce. Nous proposons aux entreprises une suite unique de solutions leur permettant de transformer significativement leur activitĂ© digitale afin d'accĂ©lĂ©rer de façon durable et rentable leur croissance. 

Depuis 2012, Mirakl accompagne les entreprises B2C et B2B avec la technologie la plus avancée, sécurisée et évolutive leur permettant de digitaliser leur activité et d'élargir leur offre via la marketplace ou le dropship, faciliter la gestion des catalogues et des paiements de leurs fournisseurs pour plus d'efficacité, offrir une expérience d'achat personnalisée à leurs clients, et augmenter leurs profits grùce au retail media.

Mirakl est le partenaire de choix de plus de 450 entreprises leaders dans le monde, dont Airbus, Maisons du Monde, Decathlon, H&M, Sonepar et Toyota Material Handling. Pour plus d'informations : www.mirakl.fr 

 

A propos de Mirakl Labs

Nos Ă©quipes techniques et produits, nommĂ©es Mirakl Labs, sont principalement rĂ©parties entre nos 2 hubs situĂ©s Ă  Paris et Ă  Bordeaux. Elles collaborent au quotidien afin d'adresser les problĂ©matiques de nos clients et utilisateurs en rĂ©pondant Ă  diffĂ©rents challenges liĂ©s aux nouvelles fonctionnalitĂ©s, Ă  la scalabilitĂ©, la sĂ©curitĂ© et l’ergonomie


Elles opĂšrent en mode agile et s'organisent en Squads composĂ©es d'un Squad Lead, de 5 dĂ©veloppeurs, d'un Product Manager et d'un QA. Chaque Squad est spĂ©cialisĂ©e sur un scope fonctionnel afin de concevoir et rĂ©aliser de nouvelles features, leurs Ă©volutions et des APIs (avec un dĂ©coupage en micro-services). Nos Ă©quipes Infrastructure, Architecture, SĂ©curitĂ©, Documentation, Product Design, Data et Support opĂšrent en transverse en apportant leur expertise et de la cohĂ©rence sur l’ensemble des produits.

Toutes les Ă©quipes sont responsables de leur pĂ©rimĂštre et chacun des collaborateurs apporte son expĂ©rience et ses idĂ©es. Innovation, feedback et implication dans les prises de dĂ©cision sont au cƓur de notre philosophie.

Et pour favoriser ce partage avec d’autres passionnĂ©s, nous sommes sponsors, speakers, et hĂŽtes de diffĂ©rents Ă©vĂ©nements, meetups, et associations de la scĂšne Tech en France. Au cours des derniĂšres annĂ©es, nous avons participĂ© Ă  des Ă©vĂ©nements tels que Devoxx, ReactEurope, ProductConf et Flupa UX Days.

 

A propos du job 

IntĂ©grĂ©.e dans notre Ă©quipe Data Science, votre principale mission sera de prototyper, itĂ©rer, et mettre en production des algorithmes en collaboration avec les Ă©quipes Produit, les Data Engineers et les Ă©quipes de dĂ©veloppement. 

Vos projets seront centrés sur les enjeux du catalogue Marketplace, comprenant le NLP, la Computer Vision et l'utilisation de Generative AI (LLMs customs) à grande échelle. Les sujets que vous traiterez auront un impact significatif sur nos clients : notre ambition est d'exploiter au mieux nos données riches et variées pour augmenter leur chiffre d'affaires, optimiser la gestion de leur marketplace et garantir la sécurité des utilisateurs et des transactions.

Nous cherchons des personnes en CDI, sur Paris, Bordeaux ou en full remote

Sujets catalogue : 

  • Réécriture automatique du contenu Marketing en fonction des attentes mĂ©tier
  • Extraction d’attributs produit Ă  partir d’image et de texte libre
  • DĂ©tection de produits variants
  • CatĂ©gorisation de produits
  • Onboarding automatique des produits vendeurs
  • Fusion de fiches produits provenant de sources multiples
  • PrĂ©diction de produits tendance

Ce qu’il y a pour vous dans ce job :

  • ImplĂ©menter des algorithmes qui auront un impact visible sur plus de 500 sites e-commerce/marketplaces dans 40 pays dont certains une volumĂ©trie trĂšs importantes (millions de produits, de clients, de commandes par an)
  • Des techniques de pointe variĂ©es (modĂšles multimodaux, fine-tuning de LLM, etc.). Mirakl est aujourd'hui l'un des rares acteurs français Ă  avoir des LLM finetunĂ©s en production Ă  grande Ă©chelle. Rejoignez-nous pour continuer Ă  cultiver cet esprit pionnier
  • Une vraie autonomie et responsabilitĂ© dans les projets dont vous avez ownership

Notre stack et nos outils

Python, Tensorflow, Pytorch, Hugging Face, Databricks, Spark, AWS (Amazon Redshift, s3, etc.), SQL, Airflow, Delta Lake. Spécifiques LLM : Autotrain, Unsloth, Galileo, LangChain, Anyscale.

Au quotidien, vous allez :

  • Analyser, prĂ©parer les donnĂ©es, prototyper des algorithmes
  • Les mettre en production en collaboration avec les Data Engineers et les Ă©quipes de dĂ©veloppement
  • Faire des dashboards afin d’illustrer la pertinence des algorithmes et de monitorer la production
  • PrĂ©senter les rĂ©sultats au weekly data science et participer aux sessions de brainstorming de l’équipe
  • Échanger avec les autres Ă©quipes pour affiner les cas d’utilisation, l’expĂ©rience utilisateur et les modes d’intĂ©gration 

Vous aimerez ce job si :

  • Vous avez 4 ans d'expĂ©rience minimum en tant que Data Scientist, avec une expĂ©rience significative en NLP et ML appliquĂ© en entreprise
  • Vous avez dĂ©jĂ  mis en production des algorithmes de Machine Learning
  • Vous avez une bonne connaissance des algorithmes de NLP et Computer Vision et des architectures State-Of-the-Art - par exemple les Transformers. (Avoir des connaissances sur les derniers LLMs est un plus)
  • Vous maĂźtrisez Python, Tensorflow ou/et PyTorch
  • Vous avez une expĂ©rience en dĂ©veloppement Spark
  • Vous ĂȘtes pragmatique, data-driven et orientĂ© mĂ©tier
  • Vous aimez avoir l’ownership de vos sujets et vous ĂȘtes autonome et avez un trĂšs bon esprit d’équipe
  • Vous avez un esprit positif : respect et bienveillance font partie de vos valeurs
  • Vous aimez partager votre travail dans le cadre de prĂ©sentations internes, dans des confĂ©rences ou en rĂ©digeant des articles

Envie de nous rejoindre? ⭐

  • Un Ă©change tĂ©lĂ©phonique de 30 minutes avec un de nos recruteurs Tech. Ce sera l'occasion de discuter de votre parcours, de vos attentes et de dĂ©couvrir ce que Mirakl peut vous offrir en retour.
  • Un premier Ă©change technique par zoom de 30 minutes avec une personne de l’équipe Data Science, qui permettra de plonger dans des aspects plus concrets de votre expertise et de dĂ©couvrir comment vos compĂ©tences peuvent s'intĂ©grer Ă  nos projets.
  • Un cas pratique Ă  rĂ©aliser Ă  la maison.
  • Une restitution et Ă©change technique avec un manager de l’équipe Data Science de 75 minutes.
  • Un dernier Ă©change de 1H par zoom avec des futurs collĂšgues Mirakl autour de nos valeurs et de notre culture d’entreprise. 

Mirakl est engagĂ©e en faveur de la diversitĂ©, de l’égalitĂ© des chances et de l’inclusion. Nous cĂ©lĂ©brons nos diffĂ©rences car nous sommes convaincus que les qualitĂ©s visibles et invisibles de chaque Mirakl Worker sont une source de force et d’innovation. Dans le cadre de cet engagement, nous Ă©tudions toutes les candidatures sans distinction de : genre, ethnicitĂ©, religion, orientation sexuelle, handicap, Ăąge ou toute autre caractĂ©ristique protĂ©gĂ©e par la loi.

To apply: https://weworkremotely.com/remote-jobs/labs-senior-data-scientist-nlp-genai-catalog