ARTÍCULO DE INVESTIGACIÓN / RESEARCH ARTICLE

Un enfoque de algoritmos clásicos de aprendizaje automático para la identificación del estado de maduración del banano utilizando características de color RGB en imágenes

A classical machine learning algorithm approach for identifying banana ripening state using RGB color features in images

Cristhian David López-Jiménez*
Luis Eduardo Ordóñez-Santos**
Luis Octavio González-Salcedo**

* Investigador, Universidad Nacional de Colombia Sede Palmira, Departamento de Ingeniería. Ingeniero agroindustrial. Orcid-ID: https://orcid.org/0009-0005-8306-6770. cdlopezj@unal.edu.co

** Profesor titular, Universidad Nacional de Colombia Sede Palmira, Departamento de Ingeniería. Doctor en Ciencia y Tecnología de Alimentos. Orcid-ID: https://orcid.org/0000-0002-8958-027X. leordonezs@unal.edu.co

*** Profesor asociado, Universidad Nacional de Colombia Sede Palmira, Departamento de Ingeniería. Doctor en Ingeniería. Orcid-ID: https://orcid.org/0000-0003-2460-6106. logonzaleza@unal.edu.co

Correspondencia: Luis Octavio González-Salcedo. Carrera 32 12-00, Palmira (Colombia)

Proyecto asociado: Evaluación de la Maduración del Banano usando técnicas de Inteligencia Artificial, Código HERMES 56968, Universidad Nacional de Colombia Sede Palmira.

Resumen

Su valor nutricional, características sensoriales y disponibilidad durante todo el año hacen que el banano sea una de las frutas más consumidas a nivel mundial, con una alta demanda en diferentes sectores poblacionales. Durante su periodo de maduración presenta cambios en sus características organolépticas, como el color, sabor, aroma y composición nutricional. El momento oportuno de cosecha es un aspecto clave para su adecuada conservación y comercialización, pero frecuentemente se determina usando criterios subjetivos por parte del agricultor. Los métodos tradicionales basados en la observación visual o el uso de equipos especializados son costosos, imprecisos o invasivos. En este trabajo se propone el uso de herramientas computacionales basadas en algoritmos de aprendizaje automático para la clasificación del estado de maduración de bananos durante el proceso de cosecha, usando imágenes digitales de la fruta. Se evaluaron seis algoritmos clásicos de aprendizaje automático, con el fin de clasificar el estado de maduración, utilizando características de color RGB de las imágenes mencionadas. Las mejores precisiones (exactitud 0.82) se obtuvieron para los algoritmos de k-vecinos cercanos, máquinas de soporte vectorial y bosques aleatorios. Los resultados permiten abrir una agenda futura que incluya, además de las características espectrales, otras variables, como tamaño, forma y textura.

Palabras clave: análisis sensorial, aprendizaje de máquinas, Cavendish, ciencia del color, escala de maduración de Von Loesecke, Musa sp. L, visión computacional.

Abstract

Due to their nutritional value, sensory characteristics, and year-round availability, bananas are one of the most consumed fruits worldwide, with high demand across different populations. During their ripening period, bananas undergo changes in organoleptic characteristics such as color, flavor, aroma, and nutritional composition. Harvest timing is key to proper preservation and marketing, but it is often determined using subjective criteria by the farmer. Traditional methods based on visual observation or the use of specialized equipment are costly, imprecise, or invasive. This paper proposes the use of computational tools based on machine learning algorithms to classify the ripeness state of bananas during the harvesting process, using digital images of the fruit. Six classic machine learning algorithms were evaluated to classify ripeness state using RGB color characteristics of the aforementioned images. The best accuracies (accuracy 0.82) were obtained for the k-nearest neighbors, support vector machines, and random forests algorithms. The findings suggest a future agenda that includes, in addition to spectral features, other variables such as size, shape, and texture.

Keywords: sensory analysis, machine learning, Cavendish, color science, Von Loesecke ripening scale, Musa sp. L, computer vision.

INTRODUCCIóN

El banano (Musa sp. L), que pertenece a la familia de las musáceas, es un cultivo importante a nivel mundial, en razón de su alta producción y demanda global, con un elevado valor nutricional que lo hace fuente significativa de vitaminas y minerales para diferentes poblaciones [1]-[4]. A nivel mundial y alcanzando aproximadamente 138 millones de toneladas en 2024, la producción de banano se concentra en América Latina, áfrica y Asia, lo que indica que su cultivo es una fuente clave de ingresos para pequeños agricultores en muchas regiones tropicales con cerca del 15 % de la producción destinada a la exportación global; sin embargo, después de la cosecha, prácticas deficientes de la postcosecha pueden inducir a pérdidas entre un 25 y 50 % de la fruta, representando cuantiosas pérdidas económicas tanto en volumen como en valor monetario [5], [6]. Como fruta climatérica, durante su periodo de maduración, el banano cambia sus características organolépticas de color, sabor, aroma y parámetros nutricionales [7], [8].

Lo anterior hace determinante su cosecha oportuna tanto para su almacenamiento y comercialización como para su fijación de precios, siendo un aspecto crucial su calidad, determinada principalmente por su estado de madurez [9]. Hoy en día, la exigencia de frutas frescas y de alta calidad es mayor, lo que conlleva a un creciente interés en el desarrollo de técnicas para evaluar la maduración de las frutas [10].

La evaluación de la maduración en el banano es un proceso complejo que puede ser subjetivo y dependiente del criterio del evaluador [11]. Los métodos tradicionales, como la observación visual, pueden ser inexactos al comprender criterios empíricos que se basan en aspectos morfológicos y el color [12]; por su parte, otros métodos pueden ser costosos y generar daños en las frutas, como es el caso del uso de equipos para la medición de esquinas y ángulos en la superficie del fruto y la medición del calibre del fruto [13], [14]. De igual manera, el criterio de distinguir el fruto por su edad, usando en la plantación marcas con información de la diferencia de edad o fecha de embolsado del racimo, puede ser dispendioso [15].

En este proceso de evaluación, la automatización cobra importancia como un método objetivo y ágil para la clasificación adecuada del estado de maduración de la fruta [16]. En este contexto, se genera el interés por usar alternativas basadas en tecnologías emergentes. La automatización de la evaluación de la maduración de la fruta requiere su clasificación a partir del reconocimiento de patrones en un conjunto de atributos o características [17]. Al respecto, los algoritmos de aprendizaje automático han demostrado ser efectivos en la evaluación de la maduración, y han sido usados con éxito en la clasificación, detección de defectos y evaluación de la calidad de los productos agrícolas [18].

Hoy en día, la disponibilidad de dispositivos para el análisis sensorial, aunado a la capacidad de procesamiento, encaminan el reconocimiento de imágenes, una actividad del aprendizaje de máquinas aplicado a la maduración de las frutas [19], [20]. En este ámbito, la literatura reporta el uso del aprendizaje automático supervisado para evaluar y clasificar el estado de maduración de frutas y otros productos agrícolas [21]-[24].

En el contexto de la evaluación de la maduración del banano, la literatura reporta el uso de algoritmos de aprendizaje de máquinas entrenados a partir de características de imágenes [25]-[34]. Sin embargo, la literatura no reporta publicaciones realizadas para el contexto colombiano considerando el espacio RGB y usando algoritmos clásicos de aprendizaje de máquinas.

En este trabajo, se elaboraron algoritmos clásicos de aprendizaje de máquinas y se usaron para la evaluación y clasificación del estado de maduración del banano (Musa sp. L.), var. Cavendish, a partir de imágenes a color de la fruta. Para tal fin, se implementaron códigos computacionales usando el lenguaje de programación Phyton aplicado a seis algoritmos de aprendizaje automático (árboles de decisión, Bayes de ingenio gaussiano, k-vecinos cercanos, regresión logística, máquinas de soporte vectorial, y bosque aleatorio).

METODOLOGíA

Selección y preparación de las muestras de material vegetal

De una plantación local en el municipio de Palmira (Valle del Cauca, Colombia) se recolectaron 500 bananos de la variedad Cavendish en diferentes estados de maduración, desde inmadura hasta madura, y se eliminaron aquellos que presentaron signos de daño y/o enfermedad, así como los que tenían manchas o áreas decoloradas. A partir de la observación de las analogías existentes entre ellos, los bananos fueron agrupados de tal manera que cada muestra fuera representativa de la etapa de maduración y sin variación significativa en su tamaño, forma y textura.

Los bananos se lavaron y secaron cuidadosamente para la eliminación de suciedades y/o residuos de su superficie, se colocaron en canastas de plástico, para evitar su deterioro durante el transporte al Laboratorio de Frutas y Hortalizas, Universidad Nacional de Colombia Sede Palmira, donde se almacenaron en condiciones ambientales propias del mismo, para realizar registros diarios de imágenes durante una semana. Para los primeros registros de imágenes, los bananos se mantuvieron a temperatura ambiente antes de su almacenamiento por tres horas, con el fin de permitir el aclimatamiento de estos.

En esta investigación no se utilizaron tratamientos externos para acelerar el proceso de madurez, con el fin de que el proceso natural en estudio se llevara a cabo y capturar en imágenes los diferentes cambios visuales asociados a los diferentes estados de madurez tanto en cada etapa y posibles avances hacia las siguientes.

Como instrumento de registro fotográfico se usó un Smartphone Samsung Galaxy A53 5G (cámara principal resolución múltiple 64+12+5+5 MPx, apertura múltiple f/1.8+f/2.2+f/2.4+f/2.3, estabilización óptica de las imágenes, sensor 1/1.7) para capturar un total de 2552 imágenes digitales del proceso de maduración postcosecha. Las imágenes se tomaron con la cámara principal cuádruple del instrumento mencionado, a una distancia fija de 30 centímetros entre el dispositivo y las muestras del fruto, asegurándose una iluminación uniforme en todas las imágenes capturadas, utilizando un fondo blanco para evitar las interferencias en la medición del color de las muestras. Este tipo de procedimiento se replicó acorde con lo reportado en estudios similares [35], [36].

Las frutas se clasificaron y etiquetaron en cuatro clases equilibradas (638 imágenes por clase) de acuerdo con la escala de maduración de Von Loesecke [35], agrupadas de la siguiente manera: estados 1 y 2 (más verde que amarillo), estados 3 y 4 (más amarillo que verde), estados 5 y 6 (amarillo) y estado 7 (amarillo con mancha marrones), como se sugiere en [36]. En el entrenamiento supervisado de los algoritmos de aprendizaje automático, estos estados se codificaron (etiquetas a acertar) como: 1 (inmaduro), 2 (parcialmente maduro), 3 (maduro) y 4 (sobremaduro), respectivamente, como se muestra en la figura 1.

La captura de imágenes se realizó durante la maduración postcosecha, aproximación que está reportada en la literatura científica sobre clasificación del estado de maduración del banano [35], [36]. La literatura reporta estudios que respaldan que los cambios visuales en la piel del banano, especialmente en el componente de color, presentan patrones consistentes tanto en racimo como fuera de él, hecho que permite utilizar modelos entrenados en condiciones controladas de postcosecha como apoyo para la toma de decisiones en campo. En lo que concierne, Prabha y Kumar (2015) lograron más de un 99 % de precisión en la clasificación de madurez a partir de imágenes postcosecha, reconociendo que si bien es cierto que los racimos de banano en condiciones de campo reciben una iluminación diferencial, concluyen que esta técnica (traducida al español) “podría utilizarse comercialmente para desarrollar un sistema de detección completamente automático en campo que permita a los productores de banano decidir el momento adecuado para la cosecha” (pp. 1316,1326-1327) [63]. También, las mediciones basadas en índices de color y reflectancia muestran variaciones claras en valores a* (de verde a amarillo) que permiten diferenciar todas las etapas de maduración [64]. Además, se ha reportado que los modelos entrenados únicamente con información de color pueden alcanzar eficiencias superiores al 99 % [65]. Por tanto, se puede explicar e inferir que los resultados obtenidos en la etapa postcosecha se pueden extrapolar razonablemente para estimar el momento óptimo de cosecha.

Procesamiento de imágenes y extracción de características

Las imágenes se preprocesaron para eliminar fondos y sombra, y obtener la imagen original sobre fondo blanco, para lo cual se elaboró un código computacional en leguaje de programación Python (versión 3.13), en el que se usó la biblioteca de visión artificial OpenCV (versión 4.10), como se describe en [37]. Posteriormente, se eliminaron detalles no relevantes utilizando el programa de procesamiento digital de imagen ImageJ (versión 1.54j) [38]. Se utilizó la librería Colordistance del entorno RStudio (versión 2022.12.0+353) para extraer las características de color en el espacio RGB y se obtuvieron los histogramas de color, acorde con [39]; se calculó la matriz de distancia de color usando la métrica de la distancia del color calculada con la distancia euclidiana [40]. Se elaboró un dendograma combinado con mapa de calor, aplicando el procedimiento descrito por [41], [42], usando una escala de colores de azul (menor distancia) al rojo (mayor distancia) para cada nivel de maduración etiquetada.

Se aplicó el algoritmo k-means para agrupar los colores de cada imagen en 20 clústeres, usando el espacio de color L*a*b* y la referencia blanca D65, a partir de [43]; se obtuvo una paleta de color por cada estado de maduración, la cual muestra los colores promedio de cada clúster.

Finalmente, se creó un archivo en formato CSV con las características de color en espacio RGB extraídas de las imágenes, usando la función write.csv. El archivo contiene el nombre de la imagen, el número del clúster y los valores promedios de los canales rojo, verde y azul.

Entrenamiento de los algoritmos de aprendizaje automático

Para la estimación de la maduración del banano se entrenaron seis algoritmos de aprendizaje automático. Para cada uno se elaboró un código computacional usando lenguaje de programación Python (versión 3.13) [44]. El código se implementó para configurar arquitecturas de los siguientes algoritmos: árboles de decisión (DT), Bayes ingenuo gaussiano (GNB), k-vecinos más cercanos (KNN), regresión logística (LR), máquinas de soporte vectorial (SVM) y bosques aleatorios (RF), cuyos fundamentos teóricos están definidos en [45]. Para el aprendizaje supervisado de los algoritmos se usó un conjunto de entrenamiento (matriz de entrenamiento), conformado por 22 732 registros o vectores de patrones (filas de la matriz), y cuyas variables de entrada (columnas de la matriz) correspondieron a los valores del canal rojo (R), del canal verde (G) y del canal azul (B), y como variable de salida (columna final de la matriz), la etiqueta del estado de maduración; los registros se dividieron aleatoriamente para conformar los subconjuntos de entrenamiento (80 %) y de prueba (20 %), y para cada algoritmo de aprendizaje automático, el desempeño en la estimación del estado de madurez del banano se evaluó a partir del análisis de la matriz de confusión [46].

Análisis estadístico

El análisis estadístico se concentra en la evaluación de los modelos de aprendizaje automático elaborados para clasificar el estado de maduración de bananos a partir de imágenes, y a diferencia de estudios experimentales tradicionales, en este artículo se basa en métricas estadísticas que cuantifican la capacidad de estimación de los modelos y constituyen la base del análisis estadístico en este enfoque computacional.

El desempeño de los modelos de aprendizaje automático se evalúo mediante análisis estadístico direccionado en la clasificación multiclase. Se calcularon métricas que se usan en problemas de clasificación supervisada, como la exactitud (accuracy) y la precisión (precision). Estas métricas se calcularon a partir de la matriz de confusión en cada modelo, la cual resume el número de predicciones correctas e incorrectas para cada una de las cuatro clases de maduración consideradas.

Con relación a la matriz de confusión, como se define en [46], es una herramienta que permite visualizar el desempeño de los modelos de aprendizaje automático. Para los modelos de este estudio, las columnas de la matriz son el número de predicciones en cada clase, mientras las filas corresponden a las instancias en la clase real. En este ámbito, los aciertos y errores son denominados como verdaderos positivos [VP], verdaderos negativos [VN], falsos positivos [FP] y falsos negativos [FN], siendo los dos últimos conocidos como errores tipo I y II, respectivamente. Para el cálculo de las métricas se usó la biblioteca scikit-learn en el lenguaje de programación Python, y funciones como confusion_matrix y classification_report, que incorporan las ecuaciones (1), (2) [46]. Los modelos que se entrenaron con vectores RGB extraídos de las imágenes se evaluaron sobre un conjunto de prueba correspondiente al 20 % del total de los datos.

Exactitud = (VP + VN) / (VP + FP +FN +VN) (1)

Precisión = (VP) / (VP + FP) (2)

RESULTADOS Y DISCUSIóN

Extracción y análisis de características de las imágenes

En la figura 2 se presenta un dendrograma combinado con mapa de calor que ilustra la matriz de distancia basada en características RGB de las imágenes de los bananos. Los ejes representan las muestras ordenadas para resaltar similitudes, la matriz es simétrica porque la distancia entre dos muestras es igual en ambos sentidos. La escala cromática del mapa de calor (de azul para menor distancia a rojo para mayor distancia) representa la similitud entre colores (de alta similitud, azul, a baja similitud, rojo). A pesar de que el dendrograma queda parcialmente cubierto por el mapa de calor, los niveles jerárquicos se resaltan en la parte superior mediante cuatro círculos rojos que identifican claramente los clústeres correspondientes a los diferentes estados de maduración.

La figura 3 presenta las paletas promedio correspondientes a cada estado de maduración del banano y permiten visualizar los cambios cromáticos asociados al proceso de maduración.

En las primeras etapas (etiquetas 1 y 2) predominan los tonos verdes debido a la alta concentración de clorofila. Los bananos inmaduros (etiqueta 1) muestran colores verdes intensos (L* alto: la clorofila refleja mucha luz, dando una apariencia brillante, a* negativo: predominio de tonos verdes, b* bajo: poca presencia de amarillos o azules) [47]; mientras que, en estados parcialmente maduros (etiqueta 2), aparecen tonos verdes claros y oscuros debido a una degradación parcial de la clorofila y síntesis inicial de carotenoides (L* moderado-alto: leve disminución por inicio degradación de la clorofila, a* menos negativo: transición de verde hacia neutro, b* en aumento: primeras señales de carotenoides (amarillos) que empiezan a manifestarse) [47].

En el estado maduro (etiqueta 3) predominan tonos amarillos brillantes y claros, así como matices de verdes en áreas menos maduras por la descomposición completa de la clorofila y revelación de pigmentos carotenoides y/o polifenoles (L* moderado: color más profundo que el verde brillante inicial, a* cercano a 0: pérdida del componente verde sin desarrollo de rojos, b* alto: máxima expresión de amarillos por acumulación de carotenoides) [10].

Finalmente, en estados sobremaduros (etiqueta 4) aparecen tonos amarillos oscuros y marrones debido a procesos oxidativos que generan melaninas y quinonas (L* bajo: oscurecimiento por pigmentos de oxidación, a* positivo: aparición de tonos rojizos/ marrones por oxidación de polifenoles, b* moderado: disminución de amarillos puros por mezcla con tonos oscuros) [48].

Entrenamiento de algoritmos de aprendizaje automático

La tabla 1 resume los resultados del entrenamiento de los seis algoritmos de aprendizaje automático en la estimación del estado de maduración del banano, mostrando el desempeño para predecir cada etapa de maduración (precision) y la exactitud (accuracy) como indicador general, Por su parte, la figura 4 muestra la matriz de confusión para cada estado de maduración. En el anexo se publican los scripts de los algoritmos implementados.

La implementación de un algoritmo DT, con el mejor conjunto de hiperparámetros encontrado mediante Grid Search (Criterio Gini, profundidad máxima de 8 niveles, mínimo de muestras por nodo 2 y mínimo de muestras para dividir por nodo 3), evidencian un moderado desempeño en la estimación del estado de maduración del banano, con exactitud de 0.61. El análisis de la matriz de confusión visualiza una buena precisión (0.86) con moderada sensibilidad (0.66) para el estado inmaduro; moderadas precisiones (0.57, 0.50), pero menores que sus sensibilidades (0.65) para los estados maduro y sobremaduro; mientras que el estado parcialmente maduro, a pesar de su moderada precisión (0.62), su combinación de métricas fue el más bajo. En general, la aplicación del algoritmo DT muestra un buen balance entre la tasa de falsos positivos y verdaderos positivos para cada clase, buena capacidad de discriminación y un desempeño moderado.

Entrenamiento del modelo de árboles de decisión (DT)

Entrenamiento del modelo de Bayes ingenuo Gaussiano (GNB)

La implementación de un algoritmo GNB muestra un bajo desempeño, acorde con la exactitud (0.40) y el análisis de la matriz de confusión, en la cual se visualiza la dificultad para predecir correctamente las clases, reportando precisiones (0.46, 0.31, 0.34, 0.46) y sensibilidades (0.63, 0.01, 0.65, 0.33) bajas, específicamente para las clases 2 y 4. Estos resultados revelan un funcionamiento irregular del algoritmo y evidencian la limitación del mismo para distinguir adecuadamente entre las diferentes clases de maduración.

Entrenamiento del modelo de k-vecinos más cercanos (KNN)

Los resultados obtenidos con la implementación de un algoritmo KNN muestran una alta exactitud (0.82) y efectividad en la clasificación de las etapas de maduración. Al respecto, el análisis de la matriz de confusión visualiza altas precisiones para cada etapa (0.84, 0.80, 0.80, 0.86); se observa dificultad en la predicción de las etapas de maduración intermedia, y se infiere que es debido a cambios sutiles del color. Con relación a las métricas asociadas a la matriz, también se observan resultados altos de sensibilidad (0.87, 0.72, 0.82, 0.90) en los que se observa concordancia en la relación precisión-sensibilidad de las etapas de maduración intermedia.

Las métricas muestran un buen balance entre las tasas de falsos positivos y verdaderos positivos para cada clase, así como una buena capacidad de discriminación. Para este problema de predicción, el mejor valor de K correspondió a 1, lo que significa que, para clasificar una muestra nueva, el algoritmo considera solamente el vecino más cercano; un valor de k bajo funciona bien en este tipo de problemas en razón de que las características del color definen claramente las etapas de maduración. Por otra parte, el algoritmo, utilizando la distancia euclidiana entre muestras en el espacio RGB, puede discriminar efectivamente entre etapas de maduración.

Para el mejor algoritmo LR implementado (modelo multicategórico con solucionador L-BFGS, 1000 iteracciones), su desempeño muestra una exactitud medianamente moderada (0.47) y efectividad variable en la clasificación de cada etapa. El análisis de la matriz de confusión visualiza, acorde con la precisión (0.62, 0.27, 0.46, 0.47), dificultades en la clasificación de la etapa 2, buena clasificación para la etapa 1 y medianamente moderada para las etapas 3 y 4; este comportamiento se repite para la sensibilidad (0.69, 0.12, 0.61, 0.47). El estado de maduración 2 presentó los valores más bajos de desempeño, acorde con la combinación de las métricas de la matriz de confusión, confirmando la dificultad del algoritmo para su clasificación.

Entrenamiento del modelo de regresión logística (LR)

Entrenamiento del modelo de máquinas de soporte vectorial (SVM)

Con relación al algoritmo SVM (la mejor configuración utilizó un kernel RBF (gaussiano), C = 100, gamma = 100), un desempeño global en la predicción del estado de maduración mostró una buena exactitud (0.82), y para cada etapa de maduración. El análisis de la matriz de confusión visualiza una alta precisión (0.85, 0.80, 0.79, 0.85), así como para la sensibilidad (0.84, 0.72, 0.84, 0.88); los resultados revelan la dificultad en la clasificación de las etapas intermedias, y se infiere que se debe a que los estados de maduración inicial y final de este estudio presentan características espectrales más distinguibles. Las métricas de la matriz de confusión evidencian que el algoritmo tiene un buen desempeño como clasificador, en razón de su buena precisión y sensibilidad, así como la capacidad para discriminar las etapas de maduración.

Entrenamiento del modelo de bosques aleatorios

Finalmente, se implementó un algoritmo de RF (la mejor configuración utilizó 100 árboles de decisión, profundidad máxima de 30 niveles, al menor 10 muestras para realizar un Split, al menos 2 muestras en cada hoja), cuyos resultados de desempeño global mostraron una buena exactitud (0.82). El análisis de la matriz de confusión visualiza para cada etapa de maduración alta precisión (0.86, 0.79, 0.79, 0.84), así como alta sensibilidad (0.83, 0.73, 0.84, 0.88), lo cual infiere que se presentan dificultades en ambas métricas para la clasificación de los estados intermedios, y en particular para el estado 2; las métricas evidencian que el algoritmo es sólido como clasificador, alta precisión y sensibilidad en cada etapa, así como la habilidad para distinguir efectivamente las categorías.

Comparación con estudios similares

Para estudios similares, en la evaluación de la maduración del banano basado en el espacio RGB, la literatura reporta el uso de los algoritmos DT, KNN, SVM y RF; sin embargo, no reporta el uso de los algoritmos GNB y RL, como se muestra en la tabla 2. Los resultados de estos estudios permiten inferir que el desempeño en los algoritmos de aprendizaje automáticos se mejora con la inclusión de variables complementarias a las características del color de la imagen, basadas en el espacio RGB, como las características de la textura, de la morfología, e hiperespectrales; al respecto, en la estimación de la maduración en frutas, la literatura reporta que las características hiperespectrales permiten detectar cambios bioquímicos internos como la degradación de la clorofila, mientras que las características de la textura y morfológicas permiten identificar patrones relacionados con la maduración no lineales como la presencia de manchas, rugosidad en la piel, entre otros [60], [61].

La literatura no reporta estudios relacionados con la estimación de la maduración del banano usando algoritmos clásicos de aprendizaje automático considerando el espacio RGB de imágenes en banano var. Cavendish realizados en Colombia; sin embargo, otros tipos de modelos han sido usados para el mismo objetivo. Al respecto, [62] elaboraron un modelo para evaluar el proceso de maduración del banano Cavendish empleando procesos gaussianos de regresión y filtros acústico-ópticos, considerando atributos multiespectrales y las intensidades de las longitudes de onda de los colores rojo, verde, azul y amarillo, día a día, durante 15 días de maduración.

CONCLUSIONES

La maduración del banano se puede visualizar generalmente a partir del cambio de color, razón por la cual varios estudios han utilizado las características del espacio de color para detectar los niveles de madurez. En este estudio se usó una metodología de extracción de características de color RGB, a partir del análisis de 2552 imágenes del fruto en cuatro estados de maduración; se utilizó un algoritmo K-Means para analizar los colores de las imágenes y generar paletas asociadas a su estado de maduración; así como el uso de seis algoritmos clásicos de aprendizaje automático para realizar la clasificación de la madurez.

En esta investigación se generaron paletas de color representativas para cada estado de maduración del banano, basadas en el análisis de 20 colores promedio por clúster. Estas paletas no solo resumen la distribución cromática característica de cada etapa, sino que también permiten visualizar la evolución de los colores dominantes a lo largo del proceso de maduración, ofreciendo una base sólida para modelos predictivos y aplicaciones en el control de calidad de la fruta.

El análisis de las paletas de color concuerda con los procesos bioquímicos descritos en la literatura, demostrando la eficacia de este método para cuantificar los cambios de color vinculados a la degradación de la clorofila y la síntesis de carotenoides. En particular, la combinación de K-Means con el espacio de color L*a*b* proporciona una representación numérica y visualmente interpretable de los estados de maduración, facilitando la identificación objetiva y automatizada de la calidad del banano.

Con respecto a la clasificación del estado de maduración, los resultados muestran que las mejores clasificaciones fueron realizadas por los modelos KKN, SVM y RF, con precisiones promedio de 82.5, 82,25, 82.0 %, respectivamente, y exactitudes de 82 % para los tres modelos mencionados.

La detección convencional del estado de maduración del banano Cavendish suele ser subjetiva y depende de la experiencia del recolector, además de factores como el cansancio y la fatiga visual. Si bien la fruta rara vez se cosecha en estados de maduración avanzados, la herramienta propuesta facilita la clasificación objetiva del estado de maduración en etapas tempranas y medias, las cuales son críticas para la toma de decisiones en campo. Basado en los resultados obtenidos con los mejores clasificadores, se concluye que la clasificación de los niveles de maduración considerados puede realizarse mediante procesamiento de imágenes digitales basado en características de color RGB, aportando al agricultor una solución de bajo costo computacional, de fácil manejo, objetiva y que evita la fatiga visual.

La comparación con estudios similares también permite concluir que la precisión en cada estado y la exactitud en general mejoran cuando además de las características del espacio de color se incluyen características morfológicas y de la textura, por lo cual se recomienda explorar nuevas investigaciones con estas consideraciones. Se abre, entonces, una agenda futura para la clasificación del estado de maduración del banano, no solo con nuevas consideraciones, sino también con el uso de otras herramientas de IA, como, por ejemplo, modelos neuronales artificiales.

REFERENCIAS

[1] M. Burgos-Hernández, “El plátano: la historia detrás de la fruta… y otros secretos”, Desde el Herbario CICY, vol. 10, pp. 203-208, sep. 2018 [En línea]. Disponible en: https://www.cicy.mx/Documentos/CICY/Desde_Herbario/2018/2018-09-13-MBurgos-El-platano.pdf
[2] K.H. Maseko, T. Regnier, B. Meiring, O.C. Wokadala y T.A. Anyasi, “Musa species variation, production, and the application of its processed flour: A review”, Scientia Horticulturae, vol. 325, feb. 2024, art. 112688.
[3] G.E. Martínez-Solórzano y J. C. Rey-Brina, “Bananos (Musa AAA): Importancia, producción y comercio en tiempos de Covid-19”, Agronomía Mesoamericana, vol. 32, nº. 3, pp. 1034-1046, sep.-dic. 2021. doi: 10.15517/am.v32i3.43610
[4] S. Leonel, M. Leonel, P. R. R. de Jesús, M.A. Tecchio, M. d. S. Silva, H.T. Cândido, N. Z. Molha y L. F. de Ouros, “Achievements of Banana (Musa sp.)-Based Intercropping Systems in Improving Crop”, Sustainability. Horticulturae, vol. 10, nº. 9, 2024, art. 956. doi:10.3390/horticulturae10090956
[5] E. I. Quevedo C., E. C. Prado C., C. A. Valarezo M. y J. P. Rentería M., “Análisis de los Beneficios Económicos y Ambientales: Producción de Banano Orgánico”, Ciencia Latina Revista Científica Multidisciplinar, vol. 8, nº. 1, pp. 6699-6709, ene.-feb. 2024. doi: 10.37811/cl_rcm.v8i1.10031
[6] A. D. Debebe y D. Dagne, “Analysis of Socio-Economic Factors Affecting Banana Production: Evidences from Lowlands of Uba Debretsehay Woreda, Gamo Gofa Zone, SNNPRS”, Journal of Economics and Sustainable Development, vol. 9, nº. 9, 2018 [En línea]. Disponible en: https://core.ac.uk/download/pdf/234648282.pdf

[7] M. E. Martínez-González, R. Balois-Morales, I. Alia-Tejacal, M. A. Cortes-Cruz, Y. A. Palomino-Hermosillo y G. G. López-Guzmán, “Postcosecha de frutos: maduración y cambios bioquímicos,” Rev. Mex. Cienc. Agríc., nº. 19, pp. 4075–4087, dic. 2017. doi: 10.29312/remexca.v0i19.674.
[8] P. S. Kumar, T. Shuprajhaa, P. Subramaniyan, A. Mohanasundaram, K. N. Shiva, M. Mayilvaganan y U. Subbaraya, “Ripening dependent changes in skin color, physicochemical attributes, in-vitro glycemic response and volatile profiling of banana varieties”, Food Bioscience, vol. 56, dic. 2023, art. 103274. doi: 10.1016/j.fbio.2023.103274
[9] M. D. Ruiz M. y J. Ruales, “Post-Harvest Alternatives in Banana Cultivation”, Agronomy, vol. 14, 2024. art. 2109. doi: 10.3390/agronomy14092109
[10] M. Rizzo, M. Marcuzzo, A. Zangari, A Gasparetto y A. Albarelli, “Fruit ripeness classification: A survey”, Artificial Intelligence in Agriculture, vol. 7, pp. 44-57, 2023. doi: 10.1016/j.aiia.2023.02.004
[11] E. G. Freitas, “Ripening assessment classification using artificial intelligence Algorithms with electrochemical impedance spectroscopy data”, Master in Electrical and Computer Engineering, NOVA Univ., Portugal, 2023.
[12] J. P. Bonilla-González y F. A. Prieto-Ortíz, “Determinación del estado de maduración de frutos de feijoa mediante un sistema de visión por computador utilizando información de color”, Rev. Investig. Desarro. Innov, vol. 7, nº. 1, pp. 111-126, 2016. doi: 10.19053/20278306.v7.n1.2016.5603
[13] S. S. Telsang, N.S. Rajpurohit, N. R. Rajput, R. A. Singh, A. B. Rajguru, H. N. Kumar, R. V. Karande y S. P. Raje, “Fruit Ripeness and Estimated Harvesting Time Detection”, IJRASET, vol. 12, nº. 9, pp. 398-401, sep. 2024. doi: 10.22214/ijraset.2024.64193.
[14] B. S. Reddy y P. Srinivas, “Effect of Fruit Size and Maturity on Selected Mechanical Properties of Tomato”, Int. J. Pure App. Biosci., vol. 5, nº. 4, pp. 1730-1737, ago. 2017. doi: 10.18782/2320-7051.5723.
[15] K. Kanchana, A. Senerath, N. Thiruchchelvan y A. Kumara, “Use of maturity traits to identify optimal harvestable maturity of banana Musa AAB cv. “Embul” in dry zone of Sri Lanka”, Open Agriculture, vol. 6, pp. 143-151, 2021. doi: 10.1515/opag-2021-0015
[16] P. J. Ascencio B., S. F. Morales y R. Aranda B., “Sistema de Maduración de frutas Mediante la Implementación de Arduino”, Ciencia Latina Revista Científica Multidisciplinar, vol. 8, nº. 6, pp. 7499-7519, nov.-dic. 2024. doi: 10.37811/cl_rcm.v8i6.15445
[17] L. R. Sucari, Y. Aroquipa D., E. Quispe Y., A. Sucari L., L. D. Quina Q. y F. A. Huanca T., “Visión artificial en reconocimiento de patrones para clasificación de frutas en agronegocios”, PURIQ, vol. 2, nº. 2, pp. 167-180, may.-ago. 2020. doi: 10.37073/ puriq.2.2.76.
[18] A. M. Pardo-Pardo y W. J. Cuervo-Bejarano, “Assessing the impact of emerging technologies on sustainable fruit production: A systematic review of the literature”, Agronomía Colombiana, vol. 41, nº. 3, pp. 1-10, 2023. doi: 10.15446/agron.colomb. v41n3.107255.
[19] F. Xiao, H. Wang, Y. Xu y R. Zhang, “Fruit Detection and Recognition Based on Deep Learning for Automatic Harvesting: An Overview and Review”, Agronomy, vol. 13, 2023, art. 1625. doi: 10.3390/agronomy13061625
[20] E. Ropelewska y Y. Noutfia, “Application of image analysis and machine learning for the assessment of grape (Vitis L.) berry behavior under different storage conditions”, Eur Food Res Technol, vol. 250, pp. 935-944, 2024. doi: 10.1007/s00217-023-04441-4.
[21] A. Muthulakshmi y P. N. Renjith, “Classification of Durian Fruits based on Ripening with Machine Learning Techniques”, presented at 2020 3rd International Conference on Intelligent Sustainable Systems (ICISS), Thoothukudi, India, 2020, pp. 542-547. doi: 10.1109/ICISS49785.2020.9316006.
[22] A. D. M. Africa, A. R. V. Tabalan y M. A. A. Tan, “Ripe Fruit Detection and Classification using Machine Learning”, International Journal of Emerging Trends in Engineering Research, vol. 8, nº. 5, pp. 1845-1849, mayo 2020. doi: 10.30534/ijeter/2020/60852020.
[23] I. K. Opara, U. L. Opara, J. A. Okolie y O. A. Fawole, “Machine Learning Application in Horticulture and Prospects for Predicting Fresh Produce Losses and Waste: A Review”, Plants, vol. 13, nº. 9, 2024, art. 1200. doi: 10.3390/plants13091200.
[24] K. V. Baskar, R. N. Sri, S. Lavanya y V. Harisha, “Deep CNN Model for predicting shelf life of fresh fruits and vegetables using temperature simulation data for optimized transport and storage”, Journal for Educators, Teachers and Trainers, vol. 15, nº. 5, pp. 425-434, 2024. doi: 10.47750/jett.2024.15.05.42.
[25] A. Mohapatra, S. Shanmugasundaram y R. Malmathanraj, “Grading of ripening stages of red banana using dielectric properties changes and image processing approach”, Computers and Electronics in Agriculture, vol. 143, pp. 100-110, 2017. doi: 10.1016/j. compag.2017.10.010
[26] L. Y. Chen, C. C. Wu, T. I. Chou, S. W. Chiu y K. T. Tang, “Development of a dual MOS electronic nose/camera system for improving fruit ripeness classification”, Sensors, vol. 18, nº. 10, 2018, art. 3256. doi: https://doi.org/10.3390/s18103256
[27] Y. Y. Pu, D. W. Sun, M. Buccheri, M. Grassi, T. M. P. Cattaneo y A. Gowen, “Ripeness classification of Bananito fruit (Musa acuminata, AA): A comparison study of visible spectroscopy and hyperspectral imaging”, Food Analytical Methods, vol. 12, nº. 8:16931704, 2019. doi: 10.1007/s12161-019-01506-7
[28] I. A. Sabilla, C. S. Wahyuni, C. Fatichah y D. Herumurti, “Determining banana types and ripeness from image using machine learning methods”, en Proc. IEEE International Conference of Artificial Intelligence and Information Technology (ICAIIT), 2019. doi: 10.1109/ICAIIT.2019.8834490

[29] N. Vetrekar, R. Ramachandra, K. B. Raja y R. S. Gad, “Multi-spectral imaging for artificial ripened banana detection”, en Proc. European Workshop on Visual Information Processing (EUVIP), 2019. doi: 10.1109/EUVIP47703.2019.8946158
[30] M. Wankhade y U. W. Hore, “Banana Ripeness Classification Based on Image Processing with Machine Learning”, International Journal of Advanced Research in Science, Communication and Technology, vol. 6, nº. 2, pp. 1390-1398, junio 2021. doi: 10.48175/ IJARSCT-1571.
[31] J. C. Hou, Y. H. Hu, L. X. Hou, K. Q. Guo y T. Satake, “Classification of ripening stages of bananas based on support vector machine”, Int J Agric & Biol Eng, vol. 8, nº. 6, pp. 99-103, dic. 2015.
[32] H. Juncai, H. Yaohua, H. Lixia, G. Kangquan y T. Satake, ‘‘Classification of ripening stages of bananas based on support vector machine’’, Int. J. Agric. Biol. Eng., vol. 8, nº. 6, pp. 99-103, 2015.
[33] W. He, H. He, F. Wang, S. Wang, R. Li, J. Chang y C. Li, ‘‘Rapid and uninvasive characterization of bananas by hyperspectral imaging with extreme gradient boosting (XGBoost)’’,Anal.Lett.,vol.55,nº.4,pp.620-633,2021.doi:10.1080/00032719.2021.1952214
[34] A. Sanaeifar, S. S. Mohtasebi, M. Ghasemi-Varnamkhasti, H. Ahmadi y J. Lozano, ‘‘Development and application of a new low cost electronic nose for the ripeness monitoring of banana using computational techniques (PCA, LDA, SIMCA, and SVM)’’, Czech J. Food Sci., vol. 32, nº. 6, pp. 538-548, 2014.
[35] Y. Zhang, J. Lian, M. Fan y Y. Zheng, “Deep indicator for fine-grained classification of banana’s ripening stages”, EURASIP Journal on Image and Video Processing, vol. 2018, art. 46, 2018. doi: 10.1186/s13640-018-0284-8
[36] A. Vacaro de Souza, J. Marques de Mello, V. Ferreira da Silva F. y F. Ferrari P., “Software for classification of banana ripening stage using machine learning”, Rev. Bras. Frutic., vol. 46, mayo-junio, 2024, art. e-863. doi: 10.1590/0100-29452024863
[37] R. R. Asaad, R. I. Ali, Z. A. Ali y A. A. Shaban, “Image Processing with Python Libraries”, Academic Journal of Nawroz University, vol. 12, nº. 2, pp. 410-416, 2023. doi: 0.25007/ ajnu.v12n2a1754
[38] J. Broeke, J. M. Mateos P. y J. Pascau, Image Processing with Image J. Birmingham, UK: Packt Publishing Ltd., 2015.
[39] H. Weller y M. Westneat, “Quantitative color profiling of images in a comparative framework using the R package colordistance”, PeerJ, vol. 7, 2019, art. e6398. doi: 10.7717/peerj.6398

[40] H. Weller, Package ‘colordistance’ –Distance Metrics for Image Color Similarity. CRAN. 2022 [En línea]. Disponible en: https://cran.r-project.org/web/packages/colordistance/colordistance.pdf. [Accedido: 28 feb 2025].
[41] H. Weller, Package ‘recolorize’ ‒Color-Based Image Segmentation: CRAN [En linea]. Disponible en: https://cran.r-project.org/web/packages/recolorize/recolorize.pdf. [Accedido: 28 feb 2025].
[42] H. Weller, Color Distance Metrics [En línea]. Disponible en: https://cran.r-project.org/web/packages/colordistance/vignettes/color-metrics.html. [Accedido: 3 marzo 2025].
[43] A. Inglis, Package ‘colouR’ - Create Colour Palettes from Images: CRAN [En línea]. Disponible en: https://cran.r-project.org/web/packages/colouR/colouR.pdf. [Accedido: 28 feb 2025].
[44] A. C. Müller y S. Guido, Introduction to Machine Learning with Python. Sebastopol, CA, USA: O’Reilly Media, Inc., 2017.
[45] B. Bhatt, A. S. Gaikwad y G. Uganya, The Fundamentals of Machine Learning. London, UK: LAP LAMBERT Academic Publishing, 2023.
[46] F. J. Ariza-López, J. Rodríguez-Avi y V. Alba-Fernández, “Control estricto de matrices de confusión por medio de distribuciones multinomiales”, GeoFocus, nº. 21, pp. 215-226, 2018. doi: 10.21138/GF.591
[47] W. S. Choo, “Fruit Pigment Changes During Ripening”, en Encyclopedia of Food Chemistry, L. Melton, F. Shahidi y P. Varelis, Eds. London, UK: Academic Press, 2019, pp. 117-123. doi: 10.1016/B978-0-08-100596-5.21656-9.
[48] S. M. Chiwate, B. T. Jadhav y S. V. Nikam, “Analysis of Physicochemical Changes During the Ripening of Cavendish Banana and Velchi Banana”, Curr Agri Res, vol.1, nº. 11, pp. 236-243, 2023. doi: 10.12944/CARJ.11.1.20
[49] A. Anushya, “Quality Recognition of Banana Images using Classifiers”, International Journal of Computer Science and Mobile Computing, vol. 9, nº. 1, pp. 100-106, enero 2020. Disponible en: https://ijcsmc.com/docs/papers/January2020/V9I1202018.pdf
[50] Z. E. Fitri, M. Silvia, A. Madjid, A. M. N. Imron y L. N. Sahenda, “Red Dragon Fruit (Hylocereus costaricensis) Ripeness Color Classification by Naïve Bayes Algorithm”, ATCSJ, vol. 5, nº. 1, pp. 21-28, junio 2022. doi: 10.33086/atcsj.X.
[51] R. G. de Luna, V. C. Magnaye, R. A. L. Reaño, K. L. Enríquez, M. K. O. Dungca, D. R. C. Filler. C. J. V. Cabrera, C. M. Reyes, S. A. J. Saballa y N. A. O. Maligalig, “Non-invasive Transport Tier Classification of Banana ‘Señorita’ (musa acuminata) Using Machine Learning Techniques”, en TENCON 2023 - 2023 IEEE Region 10 Conference, Chiang Mai, Thailand, oct. 1-nov. 3, 2023, pp. 1039-1044. Disponible en: https://conf.papercept.net/images/temp/TENCON/files/0034.pdf

[52] R. Kosasih, S. Sudaryanto y A. Fahrurozi, “Classification of six banana ripeness levels based on statistical features on machine learning approach”, International Journal of Advances in Applied Sciences, vol. 12, nº. 4, pp. 317-326, dic. 2023. doi: 10.11591/ijaas.v12. i4.pp317-326.
[53] A. H. Kahfi, M. Hasan y R. L. Hasanah, “Classification of Banana Ripeness Based on Color and Texture Characteristics”, Journal of Computer Networks, Architecture and High PerformanceComputing,vol.5,nº. 1,pp.10-17, enero2023.doi:10.47709/cnapc.vxix.xxxx
[54] S. S. Khandarkar, V. R. Wadhankar y D. S. Dabhade, “Detection and Identification of Artificially Ripened Fruits Using MATLAB”, International Research Journal of Engineering and Technology, vol. 6, nº. 6, pp. 484-487, junio 2019. Disponible en: https://www.irjet.net/archives/V6/i6/IRJET-V6I696.pdf
[55] T. Girma, S. K. Mohapatra y B. Belete, “Feature Extraction and Classification of Green Mung Bean Using Machine Learning”, International Journal of Scientific & Engineering Research, vol. 10, nº. 8, pp. 1443-1447, ago. 2019. Disponible en: https://www.ijser.org/researchpaper/Feature-Extraction-and-Classification-of-Green-Mung-Bean-Using-Machine-Learning.pdf
[56] I. M. D. Moso, S. R. L. Puda, P. O. Timaan y M. D. B. Jolito, “Evaluating the ripening stages of Musa acuminata x balbisiana (Saba) using 2D-image analysis”, Publiscience, vol. 4, nº. 1, pp. 93-98, 2021. Disponible en: https://www.publiscience.org/wp-content/uploads/2021/08/Evaluation-of-the-ripening-stages-of-Saba-banana-using-2D-Image-analysis-1.pdf
[57] B. S. Mithun, S. Shinde, K. Bhavsar, A. Chowdhury, S. Mukhopadhyay, K. Gupta, B. Bhowmick y S. Kimbahune, “Non-destructive method to detect artificially ripened banana using hyperspectral sensing and RGB imaging”, en Proc. SPIE 10665, Sensing for Agriculture and Food Quality and Safety X, 106650T. 15 mayo 2018. doi: 10.1117/12.2306367
[58] E. Jr. Piedad, J. I. Larada, G. J. Pojas y L. V. V. Ferrer, “Postharvest classification of banana (Musa acuminata) using tier-based machine learning”, Postharvest Biology and Technology, vol. 145, pp. 93-100, nov. 2018. doi: 10.1016/j.postharvbio.2018.06.004
[59] L. Ma, C. Liang, Y. Cui, H. Du, H. Liu, L. Zhu, Y. Yu, C. Lu, S. Benjakul, C. Brennan y M. A. Brennan, “Prediction of banana maturity based on the sweetness and color values of different segments during ripening”, Current Research in Food Science, vol. 5, pp. 1808-1817, 2022. doi: 10.1016/j.crfs.2022.08.024
[60] C. A. Garillos-Manliguez y J.Y . Chiang, “Multimodal Deep Learning and Visible-Light and Hyperspectral Imaging for Fruit Maturity Estimation”, Sensors (Basel), vol. 21, nº. 4, 2021, art. 1288. doi: 10.3390/s21041288
[61] J. Pardede, M. G. Husada, A.N. Hermana y S. A. Rumapea, “Fruit Ripeness Based on RGB, HSV, HSL, L*a*b* Color Feature Using SVM”, en 2019 International Conference of Computer Science and Information Technology (ICoSNIKOM), pp. 1-5, 2019. Disponible en: https://www.semanticscholar.org/paper/Fruit-Ripeness-Based-on-RGB,-HSV,-HSL,-L*a*b*-Color-Pardede-Husada/fb94b0aa454417c96f65737287ac2ea35a4a3714

[62] C. Isaza, W. Ríos y J. Mosquera, “Modelo de maduración de fruto de banano empleando procesos gaussianos de regresión y filtros acusto-ópticos”, Scientia et Technica, vol. 14, nº. 38, jun. 2008. Disponible en:https://www.redalyc.org/pdf/849/84903859.pdf
[63] D. S. Prabha y J. S. Kumar, “Assessment of banana fruit maturity by image processing technique”, J Food Sci Technol, vol. 52, nº. 3, pp. 1316-1327, marzo 2015. doi: 10.1007/s13197-013-1188-3
[64] T. Ringer y M. Blanke, “Non-invasive, real time in-situ techniques to determine the ripening stage of banana”, Food Measure, vol. 15, pp. 44266-4437, junio 2021. doi: 10.1007/s11694-021-01009-2
[65] J. Zhuang, C. Hou, Y. Tang, Y. He, Q. Guo, A. Miao, Z. Zhong y S. Luo, “Assessment of External Properties for Identifying Banana Fruit Maturity Stages Using Optical Imaging Techniques”, Sensors, vol. 19, nº. 13, 2019, art. 2910. doi: 10.3390/s19132910