Fernando Peña es ingeniero civil matemático y magíster en ciencia de datos para la innovación de la Universidad de Concepción (UdeC). En esta entrevista, nos cuenta su experiencia en el programa y su visión sobre la ciencia de datos y la innmovación.
¿Cómo fue tu experiencia en el MACI?
Desde que entré al MACI, siempre sentí que pasamos los contenidos que prometían en un inicio. Haber estudiado el MACI me permitió ampliar la visión que tenía sobre todo en la parte de innovación, me ayudó a fortalecer esos puntos donde estaba más débil.
Al ser un magíster online, te permite tomar las clases desde cualquier parte del país, y la UdeC entrega todas las herramientas necesarias para facilitar la comunicación, y que aunque fuera online, pudiéramos comunicarnos eficientemente. Por otro lado, las jornadas presenciales (una al trimestre) fueron muy enriquecedoras.
Realicé mi tesis de la predicción del umbral de +2.5 goles en el fútbol mundial en base a datos históricos y algoritmos de machine learning.
Respecto a su tesis comenta que, «al principio no tenía una idea clara sobre de qué podía hacer mi tesis, y justo con la pandemia hubo un auge en las casas de apuestas. La pregunta era si podría calcular mejor una probabilidad que la casa de apuestas. Así que me puse a calcular mi propia probabilidad en base a la histórica de los resultados de los equipos, resultados previos y ahí fui explorando la parte de obtención de datos y conocer las variables que más influyen.
Ahí me di cuenta que mis probabilidades estaban correlacionadas con las probabilidades de ellos, sin conocer yo los algoritmos que utilizaban; era interesante ver que de distintos caminos llegábamos a lo mismo.
¿Cuál es la importancia de la ciencia de datos para la innovación?
La ciencia de datos se puede aplicar para cualquier problema, porque si uno entiende los datos, pones el algoritmo y ahí está, la programación, la estadística, y todo eso está empaquetado. Hoy en día cualquiera puede acceder a los algoritmos de manera online, ya no hay restricciones para eso.
La parte fundamental de esto, y que se inculca harto, es el conocimiento del dominio, el saber qué estoy haciendo, qué variable estoy usando, ¿mi algoritmo está respondiendo a lo que quiero?, ¿estas variables de verdad influyen? Esa es la parte más difícil.
Saber cuáles son las variables, porque cualquiera puede hacer un algoritmo, escribir una línea de código, pero lo complejo es identificar claramente qué es lo que de verdad influye, en este caso, el aprendizaje supervisado es lo que más influye en el resultado final.
Al final, creas un molde en tu cabeza, que después puedes ajustar a otro problema. Por ejemplo, yo trabajé con datos de fútbol, hay goles, partidos, equipos, ligas, etc. pero después puedo ir perfectamente -por ejemplo- a un hospital, que tiene pacientes, salas de atención, horarios; entonces tu mente ya tiene esa lógica de trabajo.
El MACI ayuda mucho a realizar ese molde, para poder abordar problemas de ciencia de datos donde uno no es experto en el dominio, pero puede apoyar en primera instancia todo lo que tiene que ver con la parte técnica y la de implementación de algoritmos.
El magíster en Ciencia de Datos para la innovación cuenta con una pasantía internacional donde sus estudiantes pueden participar de cursos relacionados con las temática tratadas, conocer su ecosistema, visitar empresas líderes y sus experiencias en la materia, así como también ver casos aplicados de innovación en ciencia de datos.
¿Qué te pareció la pasantía en Harvard?
En la pasantía conocimos Harvard, aprendimos su historia, tuvimos clases con académicos destacados, como Pavlos Protopapas, que nos dio otra mirada. Por ejemplo, nos enseñaba el algoritmo de una manera más allá, como la lógica, qué es lo que busca cada algoritmo.
Aquí en Chile estamos muy alejados de esa inversión en tecnología que en ocasiones es muy necesaria y aquí tenemos harta gente con talento. Reconocer esas brechas nos ayuda a replantearnos las cosas que podemos proponer. Llegar con esa mirada de lo que podemos hacer nos permite tener ese bagaje para poder proponer ideas en el trabajo, independiente de donde se esté.
Con los ramos de analítica ya pasados, pudimos verlos desde otra perspectiva, entonces llegar con esos conocimientos nos permitió complementarlos, fue una gran oportunidad.
El Magíster en Ciencia de Datos para la Innovación tendrá su próxima versión en marzo 2023 y ya tiene confirmada su pasantía a IACS – HARVARD.