Fundamentos de la ciencia de datos para el aprendizaje automático

Ruta de aprendizaje
14 Módulos

Principiante

Intermedio

Ingeniero de IA

Científico de datos

Desarrollador

Estudiante

Azure

Microsoft Learn proporciona varias maneras interactivas de obtener una introducción al aprendizaje automático clásico. Estas rutas de aprendizaje le permitirán ser productivo por sí mismo y también son una base excelente para pasar a temas de aprendizaje profundo.

Desde los modelos de Machine Learning clásicos más básicos hasta el análisis exploratorio de datos y la personalización de arquitecturas, se le guiará por contenido conceptual fácil de entender y cuadernos interactivos de Jupyter, todo ello sin salir del explorador.

Elija su propia ruta en función de su experiencia educativa y sus intereses.

✔ Opción 1: Curso completo: Fundamentos de la ciencia de datos para el aprendizaje automático

Esta es la opción recomendada para la mayoría de gente. Tiene los mismos módulos que las otras dos rutas de aprendizaje, con un flujo personalizado que maximiza el refuerzo de conceptos. Si quiere obtener información sobre los conceptos subyacentes, así como sobre la forma de empezar a compilar modelos con las herramientas de aprendizaje automático más comunes, esta es la ruta de acceso idónea. También es la más adecuada si planea ir más allá del aprendizaje automático clásico y obtener una educación en redes neuronales y aprendizaje profundo, que solo se presentan aquí.

✔ Se encuentra actualmente en esta ruta, desplácese hacia abajo para comenzar.

Opción 2: La ruta de aprendizaje Descripción de la ciencia de datos para el aprendizaje automático

Si quiere comprender cómo funciona el aprendizaje automático y no tiene muchos conocimientos matemáticos, esta es la ruta perfecta. No da por supuesto nada sobre la educación anterior (más allá de cierta familiaridad con los conceptos de codificación) y enseña con código, metáfora y objeto visual que aportan el efecto eureka. Es práctica, pero se centra más en comprender los aspectos básicos, y menos en la potencia de las herramientas y bibliotecas disponibles.

Opción 3: La ruta de aprendizaje Creación de modelos de Machine Learning

Si ya tiene algunas nociones de qué trata el aprendizaje automático o tiene una sólida experiencia en matemáticas, puede que le interese saltar directamente a la ruta de aprendizaje Creación de modelos de Machine Learning. En estos módulos se enseñan algunos conceptos de aprendizaje automático, pero se avanza rápido para poder demostrar la eficacia de usar herramientas como scikit-learn, TensorFlow y PyTorch. Esta ruta de aprendizaje también es la más adecuada si busca la suficiente familiaridad a fin de comprender los ejemplos de aprendizaje automático para productos como Azure ML o Azure Databricks.

Requisitos previos

Ninguno

Módulos en esta ruta de aprendizaje

Introducción al aprendizaje automático

Información general de alto nivel sobre el aprendizaje automático para personas con conocimientos básicos o nulos de informática y estadística. Aprenderá algunos conceptos esenciales, explorará los datos, recorrerá de forma interactiva el ciclo de vida del aprendizaje automático y se valdrá de Python para entrenar, guardar y usar un modelo de Machine Learning de la misma manera que en el mundo real.

Creación de modelos de aprendizaje automático clásicos con aprendizaje supervisado

El aprendizaje supervisado es una forma de aprendizaje automático en la que un algoritmo aprende a partir de ejemplos de datos. De forma progresiva, dibujamos un panorama que muestra cómo el aprendizaje supervisado genera automáticamente un modelo que puede realizar predicciones sobre el mundo real. También explicamos cómo se prueban estos modelos y las dificultades que pueden surgir al entrenarlos.

Introducción a los datos para el aprendizaje automático

La eficacia de los modelos de aprendizaje automático procede de los datos que se usan para entrenarlos. A través del contenido y los ejercicios, exploraremos cómo comprender los datos, cómo codificarlos para que el equipo pueda interpretarlos correctamente, cómo limpiar cualquier error y veremos sugerencias que le ayudarán a crear modelos de alto rendimiento.

Exploración y análisis de datos con Python

La exploración y el análisis de datos son la base de la ciencia de datos. Los científicos de datos necesitan conocer lenguajes de programación como Python para poder explorar, visualizar y manipular datos.

Aprendizaje y conocimiento de los modelos de regresión en el aprendizaje automático

Se puede decir que la regresión es la técnica de aprendizaje automático más usada, que normalmente subyace a descubrimientos científicos, planes de empresa y análisis de mercado de valores. Este material analiza algunos de los análisis de regresión más conocidos, algunos sencillos y otros más complejos, y proporciona información sobre cómo evaluar el rendimiento del modelo.

Mejora y prueba de modelos de Machine Learning

Cuando pensamos en el aprendizaje automático, a menudo nos centramos en el proceso de entrenamiento. Con un poco de preparación antes de este proceso, no solo se puede acelerar y mejorar el aprendizaje, sino que también podremos tener un poco de confianza en que nuestros modelos funcionarán cuando nos enfrentemos a datos que nunca hayamos visto antes.

Entrenamiento y evaluación de modelos de regresión

La regresión es un tipo de aprendizaje automático que se usa habitualmente para predecir valores numéricos.

Creación y descripción de modelos de clasificación en el aprendizaje automático

La clasificación significa la asignación de elementos en categorías o también se puede considerar la toma de decisiones automatizada. Aquí presentamos modelos de clasificación a través de la regresión logística, lo que le proporciona un avance hacia métodos de clasificación más complejos y emocionantes.

Selección y personalización de arquitecturas e hiperparámetros mediante bosques aleatorio

A menudo, los modelos más complejos se pueden personalizar manualmente para mejorar su eficacia. Mediante ejercicios y contenido explicativo, exploramos cómo la modificación de la arquitectura de modelos más complejos puede lograr resultados más eficaces.

Matriz de confusión y desequilibrios de datos

¿Cómo se puede saber si un modelo es bueno o malo para clasificar los datos? La forma en que los equipos evalúan el rendimiento del modelo a veces puede ser difícil de comprender o puede simplificar en exceso cómo se comportará el modelo en el mundo real. Para crear modelos que funcionen de manera satisfactoria, es necesario encontrar formas intuitivas de evaluarlos y comprender cómo estas métricas pueden sesgar nuestra visión.

Medición y optimización del rendimiento del modelo con ROC y AUC

Las curvas de características operativas del receptor son una manera eficaz de evaluar y ajustar los modelos de clasificación entrenados. Presentamos y explicamos la utilidad de estas curvas a través de contenido de aprendizaje y ejercicios prácticos.

Entrenamiento y evaluación de modelos de clasificación

La clasificación es un tipo de aprendizaje automático que se usa para categorizar elementos en clases.

Entrenamiento y evaluación de modelos de agrupación en clústeres

La agrupación en clústeres es un tipo de aprendizaje automático que se usa para agrupar elementos similares en clústeres.

Entrenamiento y evaluación de modelos de aprendizaje profundo

El aprendizaje profundo es una forma avanzada de aprendizaje automático que emula el modo en que el cerebro humano aprende a través de redes de neuronas conectadas.