El modelo del perceptrón
El perceptrón es un modelo de clasificación que consiste en un hiperplano que separa el espacio en dos regiones y asigna una clase a cada una de ellas. Puede ser visto como una red neuronal de una sola neurona.
Para caracterizar al hiperplano separador utilizamos el vector normal al mismo, , (representado en amarillo en la figura siguiente) y la ordenada al origen,
, y con lo cual el hiperplano queda definido con la siguiente ecuación:
Recordemos que el vector normal w es siempre perpendicular al hiperplano.
También se puede definir de una forma más conveniente la ecuación del hiperplano como , donde el vector
ahora contiene una componente más que siempre toma el valor 1 (el término independiente), y w también tiene una componente más que representa a
. Esto facilita la notación y el desarrollo del algoritmo.
Recordemos que el hiperplano divide el espacio en dos regiones; los puntos que están sobre el hiperplano satisfacen la ecuación , los puntos que están del lado del hiperplano al que apunta el vector normal w satisfacen
, y los restantes satisfacen
. Consideraremos que el hiperplano asigna la clase "1" o "+" a los ejemplos que pertenecen a la región
, y la clase "0" o "-" a los ejemplos que pertenecen a la región
.
Es importante notar que el vector normal siempre apunta a la región de la clase "1", es decir a la región cuyos puntos satisfacen
.
Para utilizar el Perceptrón se requiere un conjunto de datos representativo del problema a resolver, con el fin de encontrar el hiperplano separador mediante un algoritmo de entrenamiento.