El Pydata es una comunidad que organiza eventos, también llamados meet ups, alrededor del mundo. Estos eventos, orientados a desarrolladores y entendidos del mundo del big data, tienen como fin crear una comunidad dónde sea posible intercambiar conocimiento y ampliar la red de networking del sector.

Este año, en Argentina, el Pydata se celebró el 29 y 30 de Septiembre en la Ciudad Universitaria de Córdoba, dónde expusieron equipos de Machine Learning de distintas empresas nacionales, y algunas internacionales, del sector IT.

Ramiro Savoie, líder del equipo de Cliengo I.A. (Pues sí, el I.A. es por Inteligencia artificial), participó del evento y este es su resumen de las novedades:

Este fue la agenda

Nemanja Djuric de Uber en el evento Pydata
Nemanja Djuric de Uber

El congreso fue abierto por Nemanja Djuric del equipo de Self-Driving Car de Uber, el cual nos explicó la arquitectura de su auto autónomo, haciendo énfasis en algunas estadísticas que motivaron este desarrollo:

  • El 94% de los accidentes viales involucra una falla humana.
  • Se calcula que hay un billón de autos en el mundo y el 96% están ociosos.
  • El 20% del espacio de la ciudad se utiliza para parking.

Una variedad importante de sensores, cámaras y GPS alimentan 250 modelos predictivos que corren en GPU en el baúl de la versión actual. Luego de varios aprendizajes el auto autónomo de Uber ya está siendo testeado en la calle y ante situaciones reales que enfrentaría un chofer a diario.

Maria Emilia Charnelli de Etermax
María Emilia Charnelli de Etermax

La segunda charla estuvo a cargo de María Emilia Charnelli de Etermax que en modalidad tutorial nos mostró como construir un Sistema de Recomendaciones con un ejemplo basado en Netflix.

Julian Bayardo de MercadoLibre

Siguiendo en la temática de recomendaciones Julian Bayardo de MercadoLibre explicó como utilizan historiales de navegación de usuario para entrenar Embeddings y recomendar productos similares basándose en los papers de Prod2Vec y MetaProd2Vec.

Lucas Bernardi de Booking

En la keynote de la tarde Lucas Bernardi de Booking, argentino trabajando en los HQ de Amsterdam, aportó las dificultades que enfrentaron haciendo recomendaciones en el dominio de la hoteleria:

  • Dispersión: Las personas viajan a lo sumo 1 vez al año.
  • Cold Start: ¿Que recomendar a un usuario nuevo?
  • Latencia: Sus modelos deben responder en menos de 10ms
  • Disponibilidad: La capacidad de las propiedades se agota.
  • Complejidad: El manejo de la agenda de los hoteles, no se pueden ofrecer dias salteados.
Cristian Martinez y Manish Saraswat de OLX

Cristian Martinez y Manish Saraswat de OLX expusieron sus experiencias en como mostrar al usuario el mejor contenido al realizar una búsqueda, como ordenar los resultados y como medirlos. Utilizando las queries de búsqueda de los usuarios como cosntruir un Embedding Query2vec para detectar productos similares.

En la segunda jornada Rafael Carrascosa de Machinalis (ahora parte de MercadoLibre) nos transmitìó su experiencia liderando proyectos de Data Science, como debemos utilizar la métrica adecuada para cada público con el que debamos comunicarnos (desde auROC hasta KPIs de negocio) y sobre como planificar y ejecutar experimentos en un tiempo limitado que nos lleven a resultados concluyentes.

Cristian García de Toptal dió una introducción a Reinforcement Learning en la que no podía faltar el caso de AlphaGo, DeepMind y sus aplicaciones al aprendizaje de juegos

Favio Vázquez divulgador reconocido del área expuso sobre metodologías y procesos para llevar adelante proyectos orientados a datos.

Julian Eisenschlos de Botmaker

Julian Eisenschlos de botmaker expuso sobre los principales avances en Modelos del Lenguaje, su utilidad en las principales tareas de NLP y en la posibilidad de realizar transfer learning, planteando el interrogante de si los mismos pueden transformarse en el ImageNet para NLP.

Santiago Hernandez de Jampp dió cierre al evento con su experiencia en segmentación de usuarios aplicado al biding de anuncios real time que realizan en plataformas Mobile.

Santiago Hernandez de Jampp

Culminaron dos días en la cual pudimos intercambiar experiencias, avances y dificultades que enfrentamos los que trabajamos en esta incipiente área con vistas de incorporar estos conocimientos a nuestro producto.

En Cliengo aplicamos de forma intensiva Procesamiento de Lenguaje Natural para obtener el mejor lead para nuestros clientes, descubrir información oculta a simple vista y aportar insights valiosos a nuestros usuarios, por lo cual estamos atentos a todos los avances en este campo.

cliengo_chatbot_registrate_gratis