Introducción
El aprendizaje automático es la base para la mayoría de las soluciones de inteligencia artificial y funciona usando grandes cantidades de datos para entrenar modelos predictivos.
Para entrenar un modelo predictivo, debe usar un marco de aprendizaje automático para determinar la relación que existe entre las características de las entidades y las etiquetas que quiere predecir para ellas. Por ejemplo, puede entrenar un modelo para predecir el precio esperado de una casa en función de características como el tamaño de la propiedad, el número de dormitorios, el código postal, etc.
Azure Databricks proporciona una plataforma de procesamiento de datos basada en Apache Spark que admite varios marcos de aprendizaje automático populares, como Scikit-Learn, PyTorch, TensorFlow y otros. En este módulo, se usa el marco de aprendizaje automático de MLlib de Spark para mostrar ejemplos, pero los principios que describe se aplican a todos los marcos de aprendizaje automático.