Adolfo Sánchez Burón
- 20 dic 2020
- 1 Min. de lectura

Gradient Boosting Machine ajustando todos los hiperparámetros

Se muestra una ejemplificación del algoritmo Gradient Boosting Machine ajustando todos los parámetros de manera automática. Se comparan dos modelos (con 14 y 12 variables).

Algoritmos empleados: Gradient Boosting Machine (GBM) ajustando hiperparámetros

Para una breve descripción del algoritmo GBM mirar el post.

Características del caso

El caso empleado en este análisis es el 'German Credit Data', que puede descargarse el dataset original desde UCI. Este dataset ha sido previamente trabajado en cuanto a:

análisis descriptivo
limpieza de anomalías, missing y outliers
peso predictivo de las variables mediante random forest
discretización de las variables continuas para facilitar la interpretación posterior

Por lo que finalmente se emplea en este caso un dataset preparado para iniciar el análisis, que puede descargarse de GitHub.

El objetivo del caso es predecir la probabilidad de que un determinado cliente puede incluir un crédito bancario. La explicación de esta conducta estará basada en toda una serie de variables predictoras que se explicarán posteriormente.

Proceso

En este post se va a seguir el proceso seguido por Boehmke y Hernández ajustando todos los hiperparámetros.

Boehmke,B.C. Gradient Boosting Machines.

Hernández, F. Gradient Boost.

Para ver el código en R y los resultados:

En HTML: RPubs

En pdf: GitHub

ML2Projects

Gradient Boosting Machine ajustando todos los hiperparámetros

Entradas Recientes