TabularConf

Evento

TabularConf es una conferencia que durante un día y en un evento online unirá a múltiples comunidades y apasionados del Data Science en España y que gira en torno a temáticas de Análisis de Datos e Inteligencia Artificial.

Temáticas

DevOps y MLOps

IA en Videojuegos

Geospatial health data

Análisis de datos

Computer Vision

Deep Learning

Data Engineering

Machine Learning

Agenda

Agenda provisional del evento

10:30 -

Presentación del Evento

PINCHA AQUÍ PARA VER EL PRIMER STREAM
PINCHA AQUÍ PARA VER LA SESIÓN DE TARDE

10:45 - Paula Moraga

Ciencia de datos geoespaciales para la vigilancia de la salud pública

Los datos de salud geoespaciales son esenciales para informar las políticas de salud pública. Estos datos pueden utilizarse para cuantificar la carga de enfermedades, comprender patrones geográficos y temporales, identificar factores de riesgo y medir desigualdades. En esta charla, describiré mi investigación que se centra en el desarrollo de métodos geoespaciales y aplicaciones de visualización interactivas para la vigilancia de la salud. Mostraré varios paquetes de R para manipular, modelizar y visualizar datos espaciales y como éstos pueden usarse para predecir el riesgo y guiar la implementación de intervenciones para la eliminación de enfermedades tropicales en varios países. También mostraré los paquetes de R epiflows para la predicción de la propagación de enfermedades por flujos de viajes, y SpatialEpiApp para el mapeo de enfermedades y la detección de clusters. Finalmente, describiré mis futuras líneas de investigación y cómo éstas pueden contribuir a mejorar la salud de la población a nivel global.

Geospatial health data

11:30 - Gema Parreño

Aprendizaje por refuerzo e Imitación en serious video-games.

La charla compara dos técnicas aplicadas de Inteligencia artificial en videojuegos para resolver el comportamiento de NPCs ( Non playable characters ) usando Unity ML Agents para el videojuego en desarrollo Mempathy.

IA en Videojuegos

12:00 - Alejandro Samarín

Masajeando datos: ETLs en la nube con Data Fusion

Building efficient and reliable data pipelines can be a time-consuming task. There are many aspects to consider; infrastructure, code, data ingress/egress, reporting, metrics, etc. Data Fusion is Google's answer to this problem, offering a managed CDAP environment to create data processing pipelines using an intuitive visual interface, with the added benefit of tight integration with the rest of Google Cloud Platform services and APIs. We'll take a tour around Data Fusion, build a real processing pipeline, throw some data at it and discuss pros and cons of this approach to ETL.

Data Engineering

12:30 - Miriam Cabrera Galván

Dime cómo juegas y me adaptaré a quién eres

¿Por qué los juegos móviles enganchan tanto? ¿Por qué la monetización en los juegos cambia constantemente? ¿Por qué los juegos se adaptan tan bien a su target? En la respuesta a estas preguntas hay un factor importante que ayuda a los diseñadores de videojuegos, ¡la ciencia de datos! En esta charla, analizaremos el importante papel de este campo en el mercado de juegos móvil. Veremos casos de ejemplo para ver cómo las métricas ayudan al engagement, posicionamiento, compras...¡Dale al play!

Análisis de datos

13:00 - Andrés Matesanz

Identifica a tu mascota con Computer Vision.

¿Eres de esas personas que les gusta trastear con la tecnología y llevar a cabo sus propios proyectos? ¿Te gustaría crear tu propio detector usando redes neuronales pero no sabes cómo? Descubre el pipeline completo que se esconde detrás del desarrollo y entrenamiento de Redes Neuronales Convolucionales para la detección de objetos. Mostraremos con código todos los pasos, desde la constucción del dataset a su entrenamiento pasando por el etiquetado. Para ello simplificaremos el proceso haciendo uso de la librería de python ImageAI y descubrirás cómo llevarlo a la práctica creando un verdadero detector de mascotas.

Computer Vision Deep learning

13:30 - Javi Fernandez Juan Calderón

Aplicaciones del Machine Learning al mundo del fútbol.

¿Es el mundo del fútbol ajeno a los datos y a la estadística avanzada? Juan nos hablará cómo un modelo predictivo de goles podría generar rentabilidad financiera de corto y largo plazo. Por su parte, Javier, explicará cómo mediante técnicas de ML se podría llegar a predecir cuál hubiera sido el resultado más frecuente en un partido de fútbol basándose en la probabilidad de gol de sus disparos (métrica avanzada conocida en el mundo del fútbol como Expected Goal, xG). Todos estos análisis con open-data y con el uso de la librería de Python streamlit para la creación y despliegue de las diferentes aplicaciones.

Análisis de datos Machine Learning

15:45 - Alejandro Samarín

Actuación Musical

Os contaré un secreto: la música 'mainstream' occidental actual es tremendamente aburrida, plana y predecible hasta decir basta. '¿Por qué?', os estaréis preguntando. Pues porque la gran mayoría de 'hits' no son más que variaciones de unos pocos patrones muy interiorizados en nuestras cabecitas. Si quieres saber más acerca de estas 'expresiones regulares musicales', no te pierdas los Minutos Musicales de TabularConf!

16:00 - Alejandro Benito Santos

”La luna deja un histograma abandonado en el aire”; Una introducción a la visualización de textos en Python con Vega-lite y Altair de la mano de F. García Lorca

La visualización de grandes corpus de textos no estructurados escritos en lenguaje natural es una tarea que ha cobrado especial relevancia debido a su capacidad para acelerar la comprensión de los mismos por parte de un observador humano. En esta charla, presentaremos la biblioteca de visualización declarativa “Altair” (https://altair-viz.github.io/) y su gramática subyacente, vega-lite (https://vega.github.io/vega-lite/), a través de un análisis visual de distintas métricas lingüísticas obtenidas a partir de una selección de obras del conocido poeta y dramaturgo español Federico García Lorca (1898-1936).

Análisis de datos

16:30 - Maria Medina

MLOps: cómo poner tus sistemas de machine learning en producción

Más allá de la parte experimental, los proyectos de data science pueden dar lugar a sistemas muy complejos y difíciles de mantener, que acabarán abandonados en un rincón si no aplicamos buenas prácticas de ingeniería del software a la hora de poner nuestros modelos en producción. Pero el mundo data science tiene unas características distintas a las del desarrollo tradicional, y por tanto muchas veces no queda claro cómo aplicar estas prácticas a los sistemas de machine learning. En esta charla haremos un repaso de las principales prácticas de la cultura DevOps y veremos cómo se pueden adaptar a proyectos de data science para generar un pipeline end-to-end de entrenamiento y despliegue de modelos de forma automática.

DevOps y MLOps

17:00 - Anna Julià Verdaguer

Mitigating Eviction Risk for Residents in the City of Dallas

La crisis de la COVID-19 ha acentuado, entre otras problemáticas sociales, la inestabilidad en la vivienda que sufre un gran número de personas en todo el mundo. Generar políticas públicas y llevar a cabo acciones para mitigarla son una de las prioridades para muchas instituciones públicas y ONGs. Éste ha sido el caso de nuestros colaboradores de The City of Dallas y Child Poverty Action Lab. Con ellos, y dentro del contexto de la plataforma Solve for Good (https://solveforgood.org/), hemos trabajado conjuntamente durante meses para analizar el impacto de los desahucios y entender qué comunidades sufren mayores efectos negativos y mayor inestabilidad residencial. En esta charla, explicaremos en más detalle el proyecto y todas sus dimensiones por lo que a datos y análisis se refiere.

Análisis de datos

17:30 - Bea Hernández

Pinta y deep-colorea

Uno de los múltiples usos de las redes neuronales es su aplicación al arte, y con esto no hablo de transferir estilos, si no de crear el tuyo propio. Vamos a dibujar y colorear con redes neuronales, desde el lienzo en blanco.

Deep learning

18:00 - JesusEtc

Actuación Musical

Jesus nos tocará algunas canciones de su grupo The Grangers al mas puro estilo Folk y Country!

18:00 -

Cierre

Sorteo y entrega de premios y obsequios....¡¡¡hasta el año que viene!!!

Ponentes

Alejandro Samarín
Alex Samarín works as a Site Reliability Engineer at wave.com. To keep things fun and diverse, he has also been freelancing as a side job for the last 3 years; this has involved heterogeneous gigs like conducting technical interviews, delivering trainings or implementing data processing pipelines. Besides computing, he likes guitars, climbing, table tennis, lockpicking and scuba diving.
Miriam Cabrera Galván
Apasionada del desarrollo de videojuegos y la ciencia de datos. Freelance Unity developer, desarrollando desde un videojuego hasta en realidad virtual. Los gráficos por computador le han el robado el corazón, pero se ha dedicado a la ciencia de datos. Participante de la edición de PlayStation Talents Games Camp 2019 y desarrolladora independiente en Papas con Mojo Games.
Anna Julià Verdaguer
Científica de datos intentando combinar dos de mis grandes pasiones y formaciones: matemáticas y sostenibilidad. En 2016 empecé en Holaluz, y desde entonces me he focalizado en proyectos de energía y modelización de la demanda. Actualmente, trabajo en el equipo de Applied Artificial Intelligence de Eurecat, participando en diferentes proyectos de datos encarados a energía e industria. En 2019, obtuve una beca para participar como estudiante en el programa Data Science for Social Good (DSSG).
Alejandro Benito Santos
Alejandro Benito-Santos (https://alexbs.me/) es miembro del grupo de analítica visual y visualización de la información de la Universidad de Salamanca (VisUSAL), donde obtuvo su doctorado desarrollando herramientas y algoritmos visuales orientados a apoyar el diseño de visualizaciones en Humanidades Digitales y otros contextos de investigación interdisciplinarios. Actualmente, alterna sus clases en el diploma experto en bioinformática y genómica computacional de la Universidad de Salamanca con su actividad investigadora en el proyecto europeo PROVIDEDH - PROgressive VIsual DEcision-Making in Digital Humanities (https://providedh.eu/). Alejandro ha publicado sus trabajos en revistas y conferencias como IEEEVIS, IEEE Computer Graphics & Applications, ADHO Digital Humanities, ACM Journal on Computing and Cultural Heritage, o el workshop en visualización para las humanidades digitales (VIS4DH), entre otros.
Javi Fernández
Javier Fernández Rodriguez. Matemático con Máster en Big Data & Data Science. Actualmente trabaja como Data Scientist in Minsait (Indra) participando en proyectos de IA en distintos sectores. Amante de los deportes y con formación en Sports Analytics, busca acercar la analítica avanzada al mundo del fútbol elaborando proyectos que ayuden en la toma de decisiones.
Juan Francisco Calderón Zumba.
Licenciado en Matemáticas con especialización en Estadística y Probabilidad, Ingeniero en Informática, Máster en Finanzas Cuantitativas por la UAB y un MBA en ESADE Business School, actualmente trabaja como Director de Ingeniería en TravelPerk y gracias a Machine Learning puede juntar sus dos pasiones, software y matemáticas.
Andrés Matesanz
Apasionado de las tecnologías, actualmente desarrollador de computer vision en Aeorum y organizador y co-fundador de la sede de Spain AI en Málaga. Estudió Óptica en la Universidad de Valladolid. Posee un Máster propio en desarrollo de realidad virtual y videojuegos y otro en Ingeniería del Software e Inteligencia Artificial en la Universidad de Málaga. Fue en esa misma universidad donde comenzó en 2018 a trabajar en el campo de la Visión por Computador para el proyecto Smart-Campus. Le encanta la música y trastear en sus ratos libres con proyectos relacionados con Machine Learning.
Maria Medina
María Medina trabaja como Data Scientist en Microsoft y co-organiza la comunidad PyLadies Madrid. Estudió informática y matemáticas y encontró la combinación perfecta de ambos campos en el mundo de los datos. Le encanta explorar datos de cualquier tipo, y sus herramientas preferidas para hacer esto son Python y R.
Paula Moraga
Paula Moraga es Profesora de Estadística en King Abdullah University of Science and Technology (KAUST) e Investigadora Principal del grupo GeoHealth. Su investigación se centra en el desarrollo de métodos estadísticos innovadores y herramientas computacionales para el análisis de datos geoespaciales y la vigilancia de la salud, y su trabajo ha contribuido directamente en la elaboración de políticas estratégicas para reducir la carga de enfermedades en varios países. Paula ha desarrollado modelos para comprender los patrones espaciales y espacio-temporales y guiar la implementación de intervenciones para reducir enfermedades como la malaria en África, la leptospirosis en Brasil y el cáncer en Australia, y ha desarrollado varios paquetes de R para la modelización Bayesiana de riesgos, la detección de clusters y la predicción de la propagación de enfermedades por flujos de viajes. Paula ha publicado extensamente en revistas líderes y es autora del libro 'Geospatial Health Data: Modeling and Visualization with R-INLA and Shiny' (2019, Chapman & Hall/CRC). Paula obtuvo su Ph.D. en Matemáticas por la Universidad de Valencia y su Máster en Bioestadística por la Universidad de Harvard.
Bea Hernández
Bea Hernández es senior data scientist en Urban Data Analytics donde se dedica a estudiar y modelar los datos del mercado inmobilario. En su tiempo libre colabora con varias comunidades como NASADatanauts y parte de la organización de R-Ladies Madrid. Además, le gusta explorar campos alternativos de la inteligencia artificial, como el arte o la música
Gema Parreño
Gema Parreno es programadora enfocada en Machine Learning. Su trayectoria incluye fundar su propia Startup de videojuegos , BBVA y Google Brain . Trabaja como Lead Data Scientist y esta desarrollando el videojuego Mempathy
Jesus Etc
Jesus se describe a si mismo como 'Un tipo de zamora que toca la guitarra.' pero aparte de humildad derrocha talento musical!!