Retour sur SunnyTech 2018, LA conférence tech de Montpellier [REX]

La saison des conférences est bien remplie cette année. La semaine dernière (28 et 29 juin 2018), je me suis rendu 2 jours à Montpellier pour assister à la 1ère édition de Sunny Tech : conf de qualité pour des techs passionnés !

Voici un résumé des conférences auxquelles j’ai pu assister (et si jamais je suis imprécis ou pire si je me fourvoie, n’hésitez à m’en informer dans les commentaires ou via Twitter)

Horacio Gonzalez

Horacio Gonzalez, OVH — ️🖼️ Slides 🖼️

1ère conférence de la journée, Horacio, l’hispano-breton le plus connu de l’hexagone, a présenté son sujet fétiche : les Web Components.

Il a tout d’abord expliqué les bases de cette technologie. Il a évoqué le Shadow-DOM pour isoler le composant par rapport à son contenant. Puis Horacio a parlé de Polymer, une technologie qu’il affectionne depuis longtemps. L’intérêt est d’apporter une couche d’abstraction — “moins de tuyauterie” — en écrivant un Web Component. C’est un peu le jQuery des Web Components. Puis il a présenté les grands outils dans ce domaine en passant en revue les avantages et les inconvénients : Slim.js, Bram.js, Skate.js et Stencil.

Le gros avantage de la technologie est de pouvoir utiliser un Web Component sans se soucier de la techno utilisée. Lors de sa démo, il a codé une page content des composants codés avec les différents outils cités précédemment. Selon Horacio, la technologie qui va percer et qui a le plus gros potentiel est Stencil.js, réalisé par les équipes d’Ionic, le fameux framework pour créer des applications hybrides.

L’équipe de helloexo.world

Horacio Gonzalez, Aurélien Hébert, Emmanuel Feller, Pierre Zemb — helloexo.world — 🖼️ Atelier 🖼️ & Slides

L’association brestoise HelloExoWorld a animé un atelier pour aider la NASA à trouver des exo-planètes. Pour ce faire, nous nous sommes armés de la bibliothèque Warp 10. La NASA fournit gratuitement plus de 25TB de données (40 millions de fichiers, avec chacun entre 100 et 3000 lignes), nous sommes partis de la luminosité des étoiles.

L’astuce étant de détecter les baisses de luminosité, correspondant au passage d’une exo-planète devant — une éclipse. Un coup de FETCH, de BUCKETIZE, de MAP, de APPLY, et nous détectons des “transits” et ainsi indiquer qu’il existe une exo-planète à cet endroit là.

Warp 10 est extrêmement puissant à tous les points de vue : ingestion, traitement… A titre de comparaison, il propose plus de 900 fonctions pour manipuler les données, là où les concurrents n’en proposent rarement plus de 50.

Warp 10 est maintenant directement intégré au monitoring du géant OVH, le leader des services clouds en Europe : 1,5 million de donnée par seconde en période calme, dans les pics de charge, cela monte à plus de 10millions. IMPRESSIONNANT !

Cet atelier est disponible à cette URL et vous pouvez le faire avec un simple navigateur.

Au passage, l’association s’agrandit, donc si le sujet vous intéresse, n’hésitez pas à les rejoindre ! Ils travaillent tous en remote !

Laurent Grangeau

Laurent Grangeau — Sogeti —Pas de slide disponible

Alexandre Grangeau a dû se démener pour ce talk qu’il devait présenter avec 3 collègues mais qui n’ont pas pu rejoindre Montpellier en temps et en heure.

Il a abordé en profondeur la notion de serverless. Serverless c’est un paradigme d’architecture logicielle qui répond à 3 objectifs :

  • On Demand : l’application démarre à la volée et très rapidement (quelques dizaines de milliseconds, pas quelques minutes)
  • Elastic : la possibilité d’ajouter/réduire le nombre d’instances nécessaires rapidement
  • Pay as you go : le fait de ne payer qu’à la consommation et pas un forfait fixe (que le coût soit interne ou sur une plateforme tierce). Ceci vaut aussi bien quand l’application n’est pas utilisé : 0 coût à ce moment là.

Néanmoins, il existe beaucoup d’autres définitions et aucune ne fait encore consensus. Ce qu’il faut retenir est que le serverless ne se limite pas à Amazon Lambda. D’autres possiblités permettent d’en faire, soit en passant par des clouds privés soit avec des technologies ouvertes.

Après avoir discuté avec Alexandre à la soirée networking, il m’a recommandé la solution OpenFaaS pour tester le serverless en interne. A tester donc !

Pour d’autres technos, vous trouverez votre bonheur aussi bien chez les géants américains (AWS, Azure, Google Cloud Platform) que sur des solutions françaises : Clever Cloud ou Scalingo (OVH ayant mis en pause son projet de OVH functions) (même si Clever Cloud et Scalingo, ne propose pas forcément l’aspect “Functions As A Service” à proprement parlé).

Florent D’Halluin

Florent D’Halluin — Netheos — ️🖼️ Slides 🖼️

Florent D’Halluin a présenté Pandas, la célébre bibliothèque python pour traiter des jeux de données. En moins de 30 minutes, il a montré l’élégance et la puissance de cet outil : sélection, filtre, aggrégation, graphiques … Pandas est devenu son outil de prédilection pour fouiller des données et valider une intuition. Avec un simple notebook Jupyter lancé en 1 minute, quelques lignes en Python et il arrive à des premières conclusions.

Eric Frichot

Eric Frichot — Freelance— Pas de slide disponible

Eric Frichot, Data Scientist marseillais, a présenté un cas client où il devait parcourir le web et récupérer certaines informations des pages trouvées. Il s’est penché sur CommonCrawl.org, une association qui lance un robot tous les mois afin de parcourir des milions de pages web et de les sauvegarder (25TB de donnée chaque moi). Ces données sont publiques et accessibles à tous ! Une mine d’or à exploiter.

Nicolas Duforet

Nicolas Duforet — Adagio Labs — Pas de slide disponible

Nicolas Duforet a comparé en 30 minutes la performance de modèles de Machine Learning en se basant sur la solution open-source H20. L’objectif était de prédire le prix de maisons dans l’Ioha. Il a donc montré : une regression linéaire, Random Forest (forêt d’arbres décisionnels) et un réseau de neurones.

Nicolas a insisté sur la simplicité d’utilisation et la disponibilité Cloud de H2O.

Même si les réseaux de neurones ont le vent en poupe en ce moment, sur cette problématique, ils se sont montrés moins bons sur le jeu de test. Le grand gagnant étant les random forest.

Luca Marchesini

Luca Marchesini —Kuzzle — Pas de slide disponible

Luca Marchesini a raconté une belle histoire : un grand bravo pour sa performance. Luca a présenté le bitcoin et la blockchain à un public qui partait en grande majorité de zéro. Transaction, hash, blockchain, cryptographie asymétrique, il est revenu sur les bases pour progressivement montré le changement de paradigme de cette technologie. Puis il présenté Ethereum et les smart-contrats. Un discours bien mené et une très belle prise de parole.

A sa manière de raconter les histoires, on en serait même jaloux de ses enfants…

Sébastien Laporte et Christophe Jolliver

Christophe Jolliver, Sébastien Laporte — Apside — Pas de slide disponible

Deux développeurs de Apside sont venus faire un retour d’expérience d’un projet de prototype avec un client. Le but : calculer la pénibilité de certains postes de travail dans un entrepôt.

Après avoir défini ce qu’est la pénibilité, ils ont présenté leur approche afin de concevoir des capteurs le moins intrusifs pour mesurer : rythme cardiaque, mouvement des bras et des jambes … De la sélection des capteurs et des cartes électroniques jusqu’aux outils de tableau de bord, ils ont passé en revue toute leur démarche.

La partie qui m’a le plus intéressée est la partie software. Le but du projet étant d’étudier la faisabilité technique, ils ont présenté les outils qui permettent de démarer rapidement un projet IoT : NodeRed, Mosquito (MQTT), la stack TIG (Telegraf, InfluxDb, Grafana). Un des reproches fait à la stack TIG est le fait qu’elle ne permet de faire que de la constation et aucune analyse plus poussée. C’est pour cette raison, qu’ils se sont penchés ensuite sur la stack Elastic : Beats, Elastic Search et Kibana. Un des avantages a été la création de graphiques beaucoup plus personnalisés.

Néanmoins, l’outil Timelion d’Elastic a la fâcheuse tendance d’appliquer une fonction de Bucketize quand le nombre de points est trop important. Bucketize, c’est le fait de regrouper un ensemble de valeurs en une seule, comme la moyenne. Cela détruit la résolution initiale. Dans ce projet là, il y avait 61 points générés à la seconde. On comprend aisément que si cela est réduit à 1 point par seconde, beaucoup d’informations sont perdues.

Un joli retour d’expérience bien mené : de la conception des capteurs à la recherche de pattern pour étudier la pénibilité au travail.

Cette pré-étude a permis à l’équipe de faire ses preuves et le client a décidé de financer la phase suivante pour attaquer les problèmes suivants et se rapprocher de l’objectif final : autonomie des capteurs, encombrement …

Philipe Charrière

🐱⚙️🦊💡☁️

Philipe Charrière — GitLab & Clever Cloud — Pas de slide disponible

Philipe a montré comment mettre en place facilement un processus de déploiement : marier son application avec des runners Gitlab et le déploiement sur CleverCloud. A l’aide de quelques fichiers de configuration, il a démontré qu’il était très facile d’exécuter des Runners sur Gitlab et d’automatiser une partie souvent critique du travail du développeur.
Un bon moment : Philippe a bien maîtrisé sa présentation/démo, ponctué d’humour et d’emojis ! 😘

Laurent Picard

Laurent Picard — Google — 🖼️ Slides 🖼️

Laurent est venu faire un tour d’horizon des API de Machine Learning disponibles sur Google Cloud Platform (aka GCP).

Cloud Natural Language : c’est le service qui fait du Natural Language Processing (NLP). On envoit du texte et nous récupérons une description fine de la phrase : entités, relation entre les termes… Une des applications les plus connues est l’analyse de sentiment. Cela est notamment utilisé par Ocado pour améliorer le service client : les messages catégorisés comme “énervé” sont traités en priorité.

Cloud Translation : le moteur de traduction le plus connu. Une des nouveautés est qu’il était basé avant sur la statistique. Un gros saut qualitatif s’est produit avec l’utilisation du deep learning et la possiblité de faire de l’apprentissage permanent. C’est Airbnb qui l’utilise pour traduire l’ensemble de son sité à tous les voyageurs et hôtes du monde !

Cloud Vision : c’est l’outil qui me plaît le plus. Vous envoyez une image et ils vous détectent tous ce qu’il faut : labellisation, détection de visage (et de sentiment), OCR (Optical Character Recognition), détection de contenus non adaptés à un public jeune (violence, sexe, drogue …), détection de points d’intérêt et de logo. L’exemple le plus bluffant a été la bonne détection entre les tours Eiffel de Paris et de Las Vegas (après recadrage et traitement pour tromper au maximum la machine). Par contre, une des limites de cet outil s’est révélé puisqu’il n’a pas été en mesure de différencer un pain au chocolat d’une chocolatine ! Un joli clin d’oeil de Laurent 😉.

Cloud Speech to text : c’est l’outil qui permet d’envoyer de l’audio et d’avoir la transcription écrite. En plus d’être de bonne qualité, cela peut être réalisé en temps réel et c’est robuste au bruit.
Le service inverse, Cloud Text to Speech existe depuis longtemps mais n’a jamais accroché car le fait d’entendre une voix de robot ne plaît pas du tout aux utilisateurs. Néanmoins, on voit la progression avec les voix des assistants personnels de type Google Home ou Amazon Alexa. Un saut énorme est en train d’être franchis avec une techno développée par l’équipe DeepMind (l’équipe londonnien à l’origine d’AlphaGo qui a conçû l’IA ayant battu le champion du monde du jeu de Go). La technologie est disponible en bêta mais le bon qualitatif est apparemment phénoménal. En termes d’efficacité, il génère en 1 seconde de calculs, 20 secondes de voix audio.

Cloud Video Intelligence : c’est le pendant vidéo de Cloud Vision. Cette API permet de détecter des séquences et autres éléments présents dans une vidéo.

Ce tour d’horizon réalisé, il a parlé du dernier produit sorti il y a à peine deux mois : AutoML Vision. Cette API met à la portée de n’importe quel développeur un entraînement automatisé d’images, sans aucune connaissancce en Data Science nécessaire !

Bien évidemment, pour ceux qui veulent se salir les mains, il reste TensorFlow !

Dernier élément de ce talk (déjà très riche) a été la mise en placce d’une mini application en serverless : le Stach Club.

Le déroulé est très simple : chaque spectateur était invité sur une URL pour prendre différente photos afin de rejoindre le club très privé : Stach Club.

Le Stache Club

Automatiquement, une moustache était ajouté sur le visage puis le visage était classifié selon l’humeur détectée. L’architecture derrière cette app était constitué de petites briques de stockage et de calcul sur GCP #serverless.

Xavier Bucchiotty

Xavier Bucchiotty — Teads — 🖼️ Slides 🖼️

Un talk retour d’expérience sur l’utilisation de React et de Redux au sein de Teads.tv. Le problème qui se pose est le fait que beaucoup de monde découvrant React se lance aussitôt dans Redux automatiquement, sans se poser les bonnes questions pour juger de l’utilité de cette solution. Or, selon Dan Abramov, créateur de Redux : n’utilisez Redux que si vous sentez que vous avez des problèmes avec React vanilla.

Redux ajoute beaucoup de code et donc autant de lignes à maintenir.

La conclusion du talk est la suivante :

  • si l’état d’un composant n’a pas d’impact sur d’autres, utilisez React STATE
  • si l’état d’un composant peut avoir un impact sur d’autres dans “la même vue”, utilisez Redux
  • si l’état d’un composant doit pouvoir être “sauvegardé (permalien), utilisez les paramètres de l’URL
Les Sunny Guards

Le mot de la fin

Encore un grand bravo à l’organisation bénévole pour ces deux jours et merci aux conférenciers pour leur disponibilités ! Les deux jours de conférences se sont merveilleusement bien passé ! Pour une 1ère édition, vous avez assurés ! Les prochaines éditions s’annonçent très prometteuses ! Je reviens sur Toulouse avec plein de technos à regarder et à tester. Ca en devient même frustrant tellement la liste était déjà bien remplie ! Ca ne s’arrêtera donc jamais !

SunnyTech, je vous remercie encore une fois et j’espère revenir l’année prochaine. En attendant, rendez-vous au DevFest Toulouse le 8 novembre 2018 #autoPromo !

ps: vous pouvez retrouver toutes les photos de l’évènement ici.

#dataScientist #techplorator #prototypeur #entrepreneur

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store