Usted está aquí:
Evaluar la calidad de los modelos
Utilice mediciones de entrenamiento para evaluar la capacidad del modelo para predecir un resultado y determinar si está listo para activarse. Las mediciones de entrenamiento proporcionan información acerca de cómo comprende de forma efectiva el modelo patrones y relaciones en los datos de entrenamiento e indica su eficacia predictiva.
Para evaluar la calidad de los modelos, es útil revisar algunos conceptos clave.
- La variable de resultado es el objetivo del modelo. Es la predicción o el resultado deseados.
- Las variables son los datos de entrada que el modelo analiza para realizar sus predicciones.
- La entrenamiento es el proceso que lleva el modelo para aprender patrones y relaciones que se pueden utilizar para realizar predicciones en datos nuevos y no vistos.
Precisión
Para medir la precisión, Einstein utiliza cuadrados de r para regresiones y área bajo la curva (AUC) para clasificaciones binarias. Basándose en umbrales estándar para el desempeño, Einstein le indica si la precisión general de su modelo tiene desempeño demasiado bajo o demasiado alto.
- Rendimiento significa que el modelo es preciso de forma general.
- Demasiado bajo significa que el modelo no es mucho mejor que la averiguación aleatoria.
- Demasiado alto significa que el modelo es perfecto o casi perfecto, lo que indica una potencial fuga o sobreajuste de datos.
Predictores principales
Los predictores principales son las entradas, o variables que tienen la mayor repercusión en predecir el resultado.
Distribución de variables
La distribución de valores reales, u observados, en los datos para la variable de resultado.
- Mediciones de regresión
Las mediciones para regresiones ayudan a evaluar el desempeño de un modelo que predice valores numéricos para datos continuos. - Mediciones de clasificación binaria
Las mediciones para la clasificación binaria ayudan a evaluar el desempeño de un modelo que categoriza datos en dos clases.

