Retour sur l’édition 2020
Programme 2020
Lundi 29 Juin 2020
17:00 – 19:00
« Open Source, Covid-19 et Sécurité »
Mardi 30 Juin 2020
17:00 – 19:00
« Open Source, IA et Containers »
17:05
Introduction
par Cédric ULMER
+ d'infos
Pendant la récente pandémie de COVID-19, MyDataModels a mis son produit de base – TADA – et le temps de consultation de l’un de ses Data Scientist en libre accès à toutes les organisations publiques travaillant sur le COVID-19. Cela comprenait des professionnels de santé qui ont utilisé TADA pour aider à découvrir des personnes potentiellement malades, données issues de réponses à des questionnaires médicaux. L’objectif de MyDataModels en collaboration avec les médecins généralistes, était d’aider à prévoir les principaux symptômes du COVID-19 et de fabriquer un modèle aussi interprétable que possible. Avec cet objectif, le processus de machine learning complet – depuis la création et le prétraitement des données jusqu’aux métriques du modèle, a été suivi par une analyse de sensibilité. Cette dernière a été progressivement consolidée dans une procédure qui fait désormais partie du produit. La technique permet de déterminer l’impact de chaque variable sur les résultats du modèle, aider à la compréhension, même pour les experts du domaine. Notez que – bien qu’utile pour illustrer les corrélations variables, l’analyse de sensibilité n’est pas censée – ni capable de – déterminer le lien de causalité ou de remplacer le consultant en santé humaine. Le processus, tel qu’il est mis en œuvre dans un cas d’utilisation lié au COVID, est présenté et une référence est faite à la littérature ouverte sous-jacente.
+ d'infos
Un projet de Machine Learning implique généralement une équipe composée de différents acteurs tels que data scientists, data analysts, data engineers, … . Les tâches réalisées par ces acteurs nécessitent des expertises et des outils+librairies divers et variés. Ces projets ML sont souvent demandeurs de ressources hardware conséquentes pour utiliser ces outils+librairies, ou tout simplement pour manipuler de grosses volumétries de données . Les équipes projets font donc souvent face à de vrais challenges pour livrer leurs applications dans des délais et des coûts acceptables. Pour mieux répondre à ces exigences, les plus grands acteurs du monde ML ont réuni leurs efforts pour proposer Kubeflow, une solution open source basée sur une architecture moderne et résolument orientée cloud (Kubernetes, microservices, serverless). Les microservices proposés par Kubeflow intègrent toute une gamme d’outils, dont certains sont déjà largement utilisés dans le monde ML (notebooks, frameworks, …), destinés à couvrir l’ensemble du cycle de vie d’un projet ML : préparation des données, mise en place de l’infrastructure, entrainement et optimisation des modèles, mises en production, suivi des performances en production, …. . Kubeflow est un produit encore jeune (la version 1.0 vient d’être publiée en début 2020), pouvant être déployé aussi bien sur des clouds publics que sur des clouds privés. Durant cette session, vous assisterez à une présentation de l’architecture et des principaux microservices déjà disponibles dans Kubeflow. A l’issue de cette session, vous aurez une vision des principales orientations prises par Kubeflow pour favoriser le développement d’applications ML.
17:45
Makers, chercheurs, industriels contre le Covid : modèles open source et limites
par Marie PELLEAU,
Paul GANELON et Julien HOLTZER
+ d'infos
A travers trois expériences différentes sur Nice et le département des Alpes Maritimes, nous présentons comment les modèles de visières fabriqués en impression 3D ou en découpe laser se sont partagés, en open source ou en libre accès, ce qu’elles ont permis de faire et les contraintes rencontrées pour y accéder, pour les modifier, pour les réutiliser.
+ d'infos
Kata Containers permet d’exécuter vos conteneurs à l’intérieur de machines virtuelles. Il fonctionne comme un remplaçant direct pour les environnements habituels d’exécution de conteneurs, offrant une isolation supplémentaire et la possibilité d’exécuter un noyau Linux configuré sur mesure pour votre application. L’intégration de Kata Containers dans Fedora 32, c’est l’histoire d’une collision entre deux packaging, rpm et go. Kata Containers permet d’exécuter des conteneurs dans des machines virtuelles individuelles, afin de fournir une meilleure isolation des applications qui tire parti de l’accélération matérielle des fonctions de virtualisation. Ajouter ce package à Fedora a provoqué un certain nombre de problèmes intéressants, avec suffisamment de pièces en mouvement simultanément pour rendre les choses lentes et difficiles. C’est un récit de mauvaise interaction entre le noyau (par exemple cgroupsv2), docker (par exemple docker vs moby vs podman) et Go (comment des langages de programmations qui ont leur propre système de packaging causent des problèmes pour les distributions comme Fedora).
+ d'infos
Frédéric d’Outpost24 fournira quelques informations sur l’intégration d’une solution Open Source IAM dans le projet LEXIS (Large-scale EXecution for Industry & Society). Après avoir effectué une analyse de la solution Open Source IAM (centrée sur les exigences et contraintes de LEXIS), le consortium a choisi de déployer «Keycloak». Après avoir déployé le logiciel en «mode autonome» à des fins de développement et d’intégration, le consortium vise maintenant à déployer Keycloak en «mode de réplication entre centres de données».
+ d'infos
Nous discuterons des différents composants qui peuvent contribuer à l’évolutivité d’un cluster Kubernetes et des applications qui y sont exécutées. Que pouvez-vous attendre de ces composants, comment collaborent-ils, ou non. J’espère que nous pourrons également discuter de certaines de leurs limites.
Intervenants
TADA : l’interprétation des modèles de prédiction COVID-19 | Lundi 29/06 à 17h10
Marie PELLEAU
Maître de conférence & Maker
Makers, chercheurs, industriels contre le Covid : modèles open source et limites | Lundi 29/06 à 17h45
Bio
Jonathan Daeden travaille depuis 8 ans dans la data science. Après un Master en Océanographie à l’Université Pierre & Marie Curie, il obtient en 2015 un doctorat en Géostatistique à l’Université de La Rochelle. Pendant deux ans aux Etats-Unis, il enseigne la géomatique à l’Université du Delaware. Depuis 2019, il a rejoint l’équipe recherche et développement chez MyDataModels pour rendre le machine learning accessible à tous. Il accompagne également entreprises et organisations publiques dans leur nouveau projet data science.
Bio
En 2012, Marie Pelleau a obtenu son doctorat en Informatique à l’Université de Nantes. Après un passage à l’Université de Montréal puis à Sorbonne Université, elle a été recrutée en octobre 2017 en tant que maître de conférences à l’Université Côte d’Azur. Depuis février 2018 elle est référente du FabLab de l’université sur le Campus Valrose où elle a supervisé de nombreux projets étudiants.
bio
Membre de Visière Solidaire Ouest 06
Makers, chercheurs, industriels contre le Covid : modèles open source et limites | Lundi 29/06 à 17h45
Retex keycloak en mode multi datacenter | Lundi 29/06 à 18h20
Bio
Julien Holtzer est co-fondateur du Fab Lab de Sophia Antipolis avec Telecom Valley et passionné d’objets connectés et d’intelligence artificielle depuis 15 ans. Il est également directeur technique pour Sogeti dans le groupe Capgemini à Sophia Antipolis, en charge des nouvelles technologies, de l’innovation et des pratiques de développement rapide (low-code, data, mobile, IoT).
bio
bio
Membre de Visière Solidaire Ouest 06
Autoscaling in Kubernetes: HPA, WPA, ClusterAutoscaler | Mardi 30/06 à 18h20
bio
Christophe travaille sur la virtualisation chez Red Hat et a récemment amené la technologie Kata Containers sur la distribution Fedora. Il est également l’auteur original de Tao3D, du langage de programmation XL et du système d’exploitation HP Integrity Virtual Machines.
bio
Je travaille pour faire de kubernetes un des meilleures endroits pour lancer Datadog avec l’équipe #Compute. J’essaie de rester en contact avec tous les aspects de l’environnement Kubernetes autant que possible avec un fort accent sur le provisionnement des ressources et la planification de la charge de travail. L’évolutivité et l’auto-guérison du système représentent également une grande partie de mes activités. Toujours prêt à coder ou à modifier un contrôleur pour rendre la plateforme plus robuste, élastique et rentable.
bio
Cédric est le président cofondateur de France Labs. Il y gère l’entreprise, mais aussi la stratégie, et les interactions clients.
Il représente Telecom Valley au CNLL, et il est membre de l’Enterprise Search Network.
Auparavant, il a travaillé dix ans à SAP Research. Cedric est diplômé de Telecom SudParis (promo 2001) et possède un certificat “Essentials of Management” de l’université de St Gallen (2009).