APLICACIÓN DE REDES NEURONALES PARA EL CONTROL DE CALIDAD DE PRODUCTOS LÁCTEOS UHT
Fabián Acquaticci, Sergio Gwirc, Diego Brengi
INTI − CITEI Instituto Nacional de Tecnología Industrial Centro de Investigación en Tecnología Electrónica e Informática
facq@inti.gov.ar, sng@inti.gov.ar, brengi@inti.gov.ar
SUMMARY
In this work a neural network based on the Kohonen’s model is used for the control of milky quality in closed and sterilized containers. The data used in the stages of training and validation were obtained through indirect mensurations carried out by means of a non destructive system for the control of milky quality in Tetra Pak containers of 250 cm3. The neural network implemented had an optimum performance in the classification of the controlled containers.
RESUMEN
En este trabajo se emplea una red neuronal basada en el modelo de Kohonen para el control de calidad láctea en envases cerrados y esterilizados. Los datos utilizados en las etapas de entrenamiento y validación fueron obtenidos a través de mediciones indirectas realizadas mediante un sistema no destructivo para el control de calidad láctea en envases Tetra Pak de 250 cm3. La red neuronal implementada tuvo un óptimo desempeño en la clasificación de los envases controlados.
APLICACIÓN DE REDES NEURONALES PARA EL CONTROL DE CALIDAD DE PRODUCTOS LÁCTEOS UHT
Fabián Acquaticci, Sergio Gwirc, Diego Brengi
INTI − CITEI Instituto Nacional de Tecnología Industrial Centro de Investigación en Tecnología Electrónica e Informática
facq@inti.gov.ar, sng@inti.gov.ar, brengi@inti.gov.ar
RESUMEN En este trabajo se emplea una red neuronal basada en el modelo de Kohonen para el control de calidad láctea en envases cerrados y esterilizados. Los datos utilizados en las etapas de entrenamiento y validación fueron obtenidos a través de mediciones indirectas realizadas mediante un sistema no destructivo para el control de calidad láctea en envases Tetra Pak de 250 cm3. La red neuronal implementada tuvo un óptimo desempeño en la clasificación de los envases controlados.
1. INTRODUCCIÓN En los métodos tradicionales de control de calidad es necesario abrir los envases de muestra para ensayarlos. La utilización de un sistema no destructivo permite ensayar el 100 % de los productos.
El principio de funcionamiento del sistema de medición utilizado está basado en la oscilación amortiguada de una caja en forma de paralelepípedo (Tetra Pak), apoyado sobre la superficie de mayor área, de tal forma que cualquier variación en su masa y/o momento de inercia sea detectada a través de la medición del período y el decaimiento de la amplitud de oscilación.
El cabezal que genera y mide las oscilaciones está formado por una bandeja donde se deposita la caja, un eje solidario a la misma para transmitir el movimiento, un resorte que une el eje con el generador de par y un solenoide rotante que genera el momento torsor en el sistema oscilante.
Una señal de corta duración mueve el solenoide, el cual a su vez aplica un momento a la bandeja que gira un ángulo θ. A partir de ese momento suelta la bandeja, la cual oscila libremente. La ecuación que gobierna el movimiento del sistema es la siguiente:
Γ
=
−k
⋅θ
=Ι⋅
∂ 2θ ∂t 2
en la que I es el momento de inercia del conjunto que rota y k es la constante de torsión que caracteriza al resorte.
1.1. Implementación del cabezal de medición El cabezal de medición, consiste en un soporte de acero inoxidable con un solenoide rotativo de 25 grados en su base. Posee en su parte superior la bandeja, solidaria al eje central, donde se coloca el envase. El eje central se conecta al eje del solenoide a través del resorte. Un sensor de posición analógico, acoplado al eje central, mide las oscilaciones del envase.
Un circuito de control se encarga de generar el pulso de disparo del solenoide, medir la señal proveniente del sensor y sincronizar la adquisición de las oscilaciones. En base a esta señal se obtienen los valores de período y amortiguamiento. (Fig. 2).
PC
Sistema de adquisición
Circuito de disparo
Ref. Comparador
Cabezal
Sensor Fig.1. Diagrama en bloques del sistema de medición
Producto
Tabla I. F. Amortig.
Período (ms)
Fig. 2. Disparo y oscilaciones del cabezal
2. IMPLEMENTACIÓN DE LA RED NEURONAL
La utilización de técnicas convencionales implica el uso de métodos estadísticos y de muestreo, siendo dificultoso obtener los valores límites utilizados en la discriminación entre los productos normales y los defectuosos. Las redes neuronales artificiales presentan un gran número de características semejantes a las del cerebro. Son capaces de aprender de la experiencia, de generalizar de casos anteriores a nuevos casos, o de extraer características esenciales a partir de entradas que representan información aparentemente irrelevante. La información contenida en una red neuronal se codifica en la estructura de la red y en los pesos de las conexiones (pesos sinápticos), los cuales pueden ser ajustados mediante un proceso de aprendizaje. La red implementada se basa en el modelo de Kohonen, el cual utiliza un entrenamiento no supervisado de tipo competitivo.
2.1. Mediciones Se realizaron mediciones de productos normales, alterados, con deformaciones en el envase y de bajo volumen.
En la tabla I se muestran algunos valores del factor de amortiguamiento1 y el período de las oscilaciones del cabezal de medición.
1 El factor de amortiguamiento (τ) se obtiene por ajuste de la envolvente de la señal a una función exponencial del tipo
− x− x0
y(x) = y0 + A× e τ
Normal (en buen estado)
Alterado (en mal estado)
envase deformado
bajo volumen
1.1069 0.8776
0.6080 0.2688
1.0766 1.1805
0.3656 0.2921
73.8095 73.0588
73.2941 69.1111
75.3200 75.4400
70.0769 69.2500
2.2. Modelo de Kohonen A pesar de la variabilidad microanatómica del cerebro, éste presenta cierta organización: Algunas neuronas cerebrales se organizan en zonas, de modo tal que la información sensorial se representa internamente en forma de mapas topológicos. El modelo genera un mapa topológico para establecer características comunes entre los vectores de entrada a la red. Pertenece a la categoría de algoritmos de aprendizaje competitivo es decir que las neuronas de la salida compiten por activarse y sólo una de ellas permanece activa ante una determinada información de entrada a la red. En función de esta única neurona activa, llamada ganadora, se ajustan los pesos sinápticos.
El algoritmo de aprendizaje utilizado para establecer los valores de los pesos de las conexiones entre N neuronas de entrada y M de salida es el siguiente:
1. Se inicializan los pesos (wij) con valores aleatorios pequeños.
2. Se presenta a la red un vector de entrada (que debe aprender): p=[p1 p2 ... pn], cuyas componentes pi serán valores continuos.
3. Puesto que se trata de un aprendizaje competitivo, se determina la neurona ganadora de la capa de salida, ésta será aquella i cuyo vector de pesos wi (vector cuyas componentes son los valores de los pesos de las conexiones entre esa neurona y cada una de las neuronas de la capa de entrada) sea el más parecido al patrón de entrada p. Para ello se calculan las distancias o diferencias entre ambos vectores, tomando una por una todas las neuronas de salida utilizando la distancia euclídea o la siguiente expresión que es similar a aquella, pero eliminando la raíz cuadrada:
N
∑ di = ( p j − wij )2 1 ≤ i ≤ M j =1
donde: pj : componente j−ésimo del vector de entrada. wij : peso de la conexión entre la neurona j de la capa de entrada y la neurona i de la capa de salida.
4. Una vez localizada la neurona vencedora (i*), se actualizan los pesos de las conexiones entre las neuronas de entrada y dicha neurona mediante la siguiente regla de aprendizaje:
win*uevo = wia*nterior + α(q)(p − wia*nterior)
0 < α(q) < 1
El factor de aprendizaje α(q) decrece con el número de iteraciones q del proceso de entrenamiento, de tal forma que cuando se ha presentado un gran número de veces todo el juego de patrones de aprendizaje su valor es prácticamente nulo, con lo que la modificación de los pesos es insignificante.
En este modelo el aprendizaje no concluye después de presentar una vez todos los patrones de entrada a la red, sino que habrá que repetir el proceso varias veces, escogiendo aleatoriamente los vectores de aprendizaje, para refinar el mapa topológico de salida.
La implementación del algoritmo se realizó utilizando GNU Octave bajo sistema operativo Debian GNU/Linux. La red empleada y el mapa de características se muestran en las figuras 3 y 4 respectivamente. La red posee dos planos de 25 neuronas, los cuales mapean el vector de entrada formado por el factor de amortiguamiento y el período de oscilación.
Los parámetros de entrenamiento son:
Factor de aprendizaje inicial: 0.9 Pendiente de la función de disminución del factor de aprendizaje: 0.001 Factor de aprendizaje final: 0.001 Función de disminución del factor de aprendizaje: lineal
Para el entrenamiento de la red se utilizaron productos normales. La red neuronal se ejecuta como parte de un algoritmo de decisión, el cual realiza el mapeo de la red, a partir de los vectores de entrenamiento, y clasifica en aprobados o rechazados los productos ensayados.
Fig. 3. Red neuronal utilizada
Fig. 4. Mapa de características 3. RESULTADOS
El desempeño de la red se verificó con los vectores de aprendizaje y con otros vectores de entrada no utilizados para el entrenamiento. Se ensayaron en total 60 productos normales, alterados, con envase deformado y bajo volumen. La red neuronal implementada tuvo un rendimiento óptimo en todos los casos, es decir, pudo diferenciar los productos normales de los restantes. En la tabla II se muestra el mapeo de la red para algunas mediciones.
Tabla II.
p1 p2 Mapeo Mapeo Producto Decisión
p1 p2
de la red
neuronal
1.0831 0.7380 21 10 normal aceptado
1.0526 0.7280 8
10 normal aceptado
0.8776 0.7306 14 10 normal aceptado
1.7627 0.7352 9
10 normal aceptado
1.0974 0.7352 21 10 normal aceptado
1.2016 0.6717 21 13 normal aceptado
0.7301 0.7282 4
10 alterado rechazado
0.6080 0.7329 17 10 alterado rechazado
0.4212 0.7407 13 15 alterado rechazado
0.3840 0.7611 23 15 alterado rechazado
1.0766 0.7532 21
15 envase rechazado deformado
1.1805 0.7544 21
15 envase rechazado deformado
0.2446 0.7356 25
10 bajo
rechazado
volumen
0.2578 0.7027 25
10 bajo
rechazado
volumen
4. CONCLUSIONES
Las redes neuronales artificiales ofrecen numerosas ventajas y justifican la aplicación de este tipo de tecnología. Como se mencionó anteriormente, la utilización de técnicas convencionales implicaría emplear métodos estadísticos y de muestreo en la calibración del sistema. Una desventaja que presenta la red es la duración del proceso de aprendizaje, el cual se incrementa con la cantidad de neuronas y la cantidad de datos de entrenamiento, y la imposibilidad de aprender nuevos datos sin tener que volver a repetir completamente el proceso de entrenamiento. Las principales ventajas al utilizar la red neuronal son:
Aprendizaje adaptativo. La red aprende a diferenciar los productos normales de los que deben ser rechazados, en base al entrenamiento.
Auto−organización. La red neuronal crea su propia organización o representación de las mediciones del factor de amortiguamiento y el período de las oscilaciones del producto ensayado.
Operación en tiempo real. La red neuronal puede implementarse para tomar decisiones durante el proceso de ensayo del producto.
5. REFERENCIAS
[1] Acquaticci, F., “Detección de complejos QRS mediante redes neuronales”, FUNDAMED, Informática Médica, número 12, 2003.
[2] Castillo E., Gutiérrez, J.M., Hadi, A.S., “Expert Systems and Probabilistic Network Models”.
[3] ElecTester, Non−destructive quality control method for UHT milk products, http://www.elecster.fi/docs/electest.htm.
[4] GNU Octave, http://www.octave.org.
[5] S. Haykin, “Neural Network. A comprehensive Foundation ”, Macmillan College Publishing Company, Inc., 1994.
[6] Ogata, K., “Ingeniería de Control Moderna”, Segunda Edición, Prentice Hall, 1993.
Ver+/-