La parole est aux speakers : David Pilato
Jusqu’au mois de mai 2026, retrouvez nos interviews de speakers pour mieux comprendre leur parcours et le sujet qu’ils ou elles aborderont lors de leur conférence !
La conférence
🎹🎻🎸 Et si nous cherchions des morceaux de musique 🎼🎶 ?Pendant cette session, nous allons utiliser les principes de la recherche vectorielle pour trouver des morceaux de musique 🎶 ressemblant (peut-être) à d'autres. Pour cela, nous ferons un rappel des principes de la génération d'embeddings pour représenter n'importe quel type de données, qu'elles soient textuelles ou binaires. |
La Comédie 22/05/2026 14:00-14:20 |
Tu proposes dans ton sujet de recherche des morceaux de musique, un rapport peut-être avec ton activité parallèle de DJ ?
Ha ha ha ! Perspicace la team !
En réalité, un de mes collègues a un jour créé cette démo et je me suis dis que c’était tellement génial si je pouvais mettre ça en relation avec mon autre passion qu’est le DeeJaying, activité que j’ai démarrée à 12 ans et pour laquelle je prends toujours autant de plaisir.
Sans spoiler la conférence, on verra qu’il faut parfois se méfier d’ailleurs des démos trop bien ficelées, mais 🤫… Donc oui, lier mes deux passions devenait une évidence, d’où ce sujet que j’adore présenter !
Tu travailles comme développeur pour Elastic, c’est comment de travailler dans une entreprise de la Silicon Valley ?
Tes informations sont incorrectes mais sois rassuré, tu n’es pas le seul à penser qu’Elastic est une société américaine. Certes, nous sommes introduits en bourse au NYSE et nous avons une grosse partie de notre activité aux US mais la maison-mère d’Elastic est basée aux Pays-Bas depuis le premier jour.
Nous sommes donc une société européenne. Côté contrat de travail, je suis salarié de la SARL française, comme plus de 100 de mes collègues en France.
Mais je n’élude pas la question pour autant, car il y a une forte influence américaine sur notre façon d’avancer. Donc, comment est-ce ? Tout d’abord il y a la barrière de la langue. Pour quasiment tous nos collègues européens, nous partageons la même « charge » de devoir processer une information rédigée en anglais. Avec le temps, on s’y habitue mais quelques fois les collègues aux US ont du mal à réaliser cet effort supplémentaire que nous faisons par rapport à eux.
L’arrivée massive des LLMs et de l’IA changent maintenant un peu la donne car il devient très facile d’avoir un résumé précis en français, voire de préparer tes idées dans ta langue natale avant d’envoyer un plan d’action.
Au delà des US, ce qui est à la fois perturbant et enrichissant, c’est la différence culturelle dans une boite où les salariés sont répartis sur tout le globe.
Les embeddings permettent de représenter de la musique, mais pas que ! C’est quoi le type de données le plus improbable que tu aies vu quelqu’un indexer dans Elasticsearch ?
Bien avant qu’on ne parle de vecteurs, il y a 2 types de données que j’ai vus représentés dans Elasticsearch à ma grande surprise :
- Le génome humain où mon ancien collègue Zachary Tong, avec sa formation de biologiste avait décrit comment on pouvait indexer les séquences génomiques et trouver des similarités entre des protéines.
- Des parties d’échecs dans lichess.org. Il y a 15 ans, Thibault Duplessis a décidé d’indexer les parties d’échecs dans Elasticsearch (aujourd’hui plus de 4,7 milliards). Un des use-cases amusant était (est peut-être encore ?) d’aller chercher un MAT aléatoirement, de revenir un coup en arrière et de proposer un CAPCHA où l’utilisateur doit faire un MAT en un coup pour prouver qu’il n’est pas un robot.
Une conférence présentée par
|
David PILATO |
Depuis 2013, David Pilato est développeur et évangéliste chez elastic.co, après avoir passé les deux années précédentes à promouvoir le projet open-source Elasticsearch. Il en anime la communauté française et organise des [BBLs](http://brownbaglunch.fr) au sein des entreprises. |