
We are searching data for your request:
Upon completion, a link will appear to access the found materials.
No hay una distinción profunda entre métodos supervisados y no supervisados, algunos de los no supervisados (como SOM o PCA) podrían usar entrenamiento, mientras que algunos supervisados (LDA, Random Forest, partición recursiva) son útiles directamente como visualizaciones.
Y hay un aprendizaje semi-supervisado intermedio. Tiene en cuenta tanto las características de los datos como el etiquetado de los datos (Figura ( PageIndex {2} )).
Una de las características más importantes de SSL es la capacidad de trabajar con una muestra de formación muy pequeña. Muchas ideas realmente brillantes están integradas en SSL, aquí ilustramos dos de ellas. El autoaprendizaje es cuando la clasificación se desarrolla en múltiples ciclos. En cada ciclo, los puntos de prueba que son más seguros se etiquetan y se agregan al conjunto de entrenamiento:

Código ( PageIndex {1} ) (R):

Como puede ver, con solo 5 puntos de datos (aproximadamente el 3% de los datos frente al 33% de los datos en iris.train), la autoaprendizaje semi-supervisada (basada en el aumento de gradiente en este caso) alcanzó el 73% de precisión.
Otro enfoque semi-supervisado se basa en la teoría de gráficos y utiliza la propagación de etiquetas de gráficos:
Código ( PageIndex {2} ) (R):
La idea de este algoritmo es similar a la que se muestra en la ilustración (Figura ( PageIndex {2} )) anterior. La propagación de etiquetas con 10 puntos supera a Randon Forest (ver arriba) que usó 30 puntos.
Le pido perdón, esto no me conviene. ¿Hay otras variaciones?
SI, la opción es buena
Están equivocados. Escríbeme en PM, habla.
¿qué?