banner

Noticias

Aug 31, 2023

Aplicaciones del aprendizaje automático en la clasificación de piñones

Scientific Reports volumen 12, Número de artículo: 8799 (2022) Citar este artículo

1128 Accesos

2 citas

2 Altmetric

Detalles de métricas

Los piñones no solo son el agente importante de la reproducción y forestación de los pinos, sino también la nuez comúnmente consumida con altos valores nutritivos. Sin embargo, es difícil distinguir entre piñones debido a la similitud morfológica entre especies. Por ello, es importante mejorar la calidad de los piñones y solucionar el problema de la adulteración de forma rápida y no destructiva. En este estudio se utilizaron como especies de estudio siete piñones (Pinus bungeana, Pinus yunnanensis, Pinus thunbergii, Pinus armandii, Pinus massoniana, Pinus elliottii y Pinus taiwanensis). Se recopilaron 210 espectros de infrarrojo cercano (NIR) de las siete especies de piñones, cinco métodos de aprendizaje automático (Árbol de decisión (DT), Random Forest (RF), Perceptrón multicapa (MLP), Support Vector Machine (SVM) y Naive Bayes (NB)) se utilizaron para identificar especies de piñones. Se utilizaron 303 imágenes para recopilar datos morfológicos para construir un modelo de clasificación basado en cinco modelos de redes neuronales convolucionales (CNN) (VGG16, VGG19, Xception, InceptionV3 y ResNet50). Los resultados experimentales de la espectroscopia NIR muestran que el mejor modelo de clasificación es MLP y la precisión se acerca a 0,99. Otro resultado experimental de imágenes muestra que el mejor modelo de clasificación es InceptionV3 y la precisión se acerca a 0.964. Se encontró que cuatro rangos importantes de bandas de onda, 951–957 nm, 1147–1154 nm, 1907–1927 nm, 2227–2254 nm, están altamente relacionados con la clasificación de los piñones. Este estudio demuestra que el aprendizaje automático es eficaz para la clasificación de piñones, proporcionando soluciones y métodos científicos para la clasificación rápida, no destructiva y precisa de diferentes especies de piñones.

Existen más de 113 especies formalmente reconocidas de Pinus Linn distribuidas principalmente en el hemisferio norte1, 2, forman parte importante de los ecosistemas forestales. Los piñones son las semillas de los pinos, es un fruto seco de consumo común, y un importante agente de forestación y reproducción3. Los piñones son ricos en proteínas, ácidos grasos, minerales y vitaminas. También contienen ácido oleico, ácido linolénico y otros ácidos grasos insaturados, que facilitan la prevención de enfermedades cardiovasculares4. El reconocimiento de especies de piñones es importante para la seguridad alimentaria y la calidad de los piñones. En los últimos años, el aumento del precio de los piñones ha traído enormes beneficios económicos. La producción mundial de piñones en 2020-2021 es de unas 381.700 toneladas. China es el principal país importador y exportador de piñones del mundo. Teniendo en cuenta la similitud visual entre los piñones, la posibilidad de adulteración de los productos es muy alta y el problema de la adulteración tiene un gran impacto en la salud y la economía. Por tanto, cómo detectar productos adulterados en piñones de forma cómoda, rápida y no destructiva es un reto para la seguridad alimentaria de los piñones.

Actualmente, los métodos comunes de identificación de especies incluyen el análisis morfológico5, la tecnología de marcadores moleculares6,7,8,9, la electroforesis de proteínas10, la cromatografía líquida11, el análisis espectral12,13,14 y el reconocimiento de imágenes15. El análisis morfológico requiere un alto nivel de experiencia que no se adquiere fácilmente y, como tal, debido a la gran similitud morfológica entre algunas especies, la tasa de identificación precisa es baja16. Aunque el uso de marcadores moleculares arroja una tasa de reconocimiento más alta y más precisión, es una metodología destructiva, requiere mucho tiempo y está limitada por la cantidad de marcadores publicados en las bases de datos públicas. Por lo tanto, este estudio establece modelos de aprendizaje automático para la clasificación de piñones basados ​​en imágenes y espectroscopia de infrarrojo cercano (NIR).

La espectroscopia NIR es una metodología que utiliza vibraciones moleculares en el espectro infrarrojo del material. El proceso de espectroscopia NIR implica que el aparato NIR emita una luz infrarroja que ingresa a la muestra. Aquí se refleja, refracta, difunde y absorbe y finalmente lleva la información de la muestra de regreso al detector. Esta metodología es conveniente, rápida, no destructiva y rentable. Se ha utilizado en muchos campos agrícolas, incluida la investigación sobre la producción de trigo17, soja18, caupí19 y arroz12. Hasta el momento, existen pocos informes sobre la aplicación de la espectroscopia NIR en la investigación forestal y de piñones. Específicamente, Tigabu et al.20 recolectaron datos espectrales visibles NIR de nueces de Pinus sylvestris en diferentes áreas y preprocesaron los datos espectrales por medio de Corrección de dispersión multiplicativa (MSC). La fuente de nueces se construyó a través del Modelado suave independiente de analogía de clase (SIMCA) y el Análisis discriminante de mínimos cuadrados parciales (PLS-DA). Loewe et al.21 recopilaron datos espectrales NIR de Pinus pinea mediterráneo de plantaciones chilenas para su clasificación. Moscetti et al.22 recopilaron los datos espectrales NIR de las nueces de P. pinea y Pinus sibirica en diferentes regiones y establecieron un modelo de clasificación espectral utilizando los métodos PLS-DA e Interval PLS-DA (IPLS-DA). Sin embargo, los efectos de otros modelos de clasificación diferentes aún necesitan ser discutidos más a fondo en más especies de piñones.

El aprendizaje automático basado en imágenes se ha aplicado con éxito a la identificación de plagas de arroz23, la detección de daños por Dendrolimus punctatus Walker24 y otros campos agrícolas y forestales. El aprendizaje profundo, un tipo de aprendizaje automático, utiliza el análisis jerárquico y el cálculo multinivel para obtener resultados. La red neuronal convolucional profunda (CNN) se ha aplicado con éxito en el reconocimiento de imágenes para aplicaciones como el reconocimiento de pesto de tomate25, el reconocimiento de imágenes de pescado26. Moscetti et al.22 recogieron los datos de imagen de las nueces de P. pinea y P. sibirica en diferentes regiones, llevaron a cabo la extracción de características, obtuvieron 10 características basadas en datos de imagen y usaron estas características para construir un modelo de clasificación basado en imágenes. Aunque la viabilidad de la clasificación de los piñones se ha demostrado en función de las características de la imagen extraídas manualmente, el modelo de clasificación automática aún merece más investigación en más especies de piñones.

Por lo tanto, el uso de la tecnología informática moderna para clasificar los piñones promueve en gran medida la investigación de la clasificación no destructiva, rápida y precisa de los piñones. En este estudio, se adopta la tecnología de aprendizaje automático y se verifica el potencial de aplicación del aprendizaje automático en la clasificación de piñones. Las contribuciones del presente trabajo son: (1) Se utilizaron marcadores moleculares para identificar especies de piñones; (2) espectroscopía NIR e imágenes de 7 piñones (dos tipos de piñones comestibles (Pinus bungeana y Pinus armandii) y cinco especies comunes (Pinus yunnanensis, Pinus thunbergii, Pinus massoniana, Pinus elliottii y Pinus taiwanensis)) fueron recolectados. (3) La espectroscopia NIR utiliza cinco métodos de aprendizaje automático para la clasificación, mientras que el reconocimiento de imágenes elige cinco modelos CNN. Este estudio verifica el potencial del aprendizaje automático en la clasificación de piñones y proporciona un método práctico para una identificación más rápida, no destructiva y precisa de las especies de piñones.

Las secuencias ITS2 y rbcL ensambladas se usaron para marcadores moleculares comparándolas con la base de datos GenBank (https://www.ncbi.nlm.nih.gov/search/all/?term=blast). La Tabla 1 muestra que la longitud de la secuencia ITS2 oscila entre 477 y 482 pb, mientras que la longitud del gen rbcL oscila entre 677 y 720 pb (Tabla 2). Los números de acceso de GenBank son OK274058-OK274066 y OK271114-OK271122. Los resultados muestran que P. massoniana, P. armandii, P. thunbergii y P. bungeana fueron reconocidas mientras que P. taiwanensis (sinónimos es Pinus hwangshanensis) no fue reconocida. No había las mismas especies en GenBank en comparación con las secuencias del gen ITS2 de P. yunnanensis y P. elliottii. Es evidente que ITS2 y rbcL son los marcadores moleculares adecuados para el reconocimiento de especies de algunos piñones y los análisis moleculares están limitados por los datos disponibles públicamente en GenBank. Luego, consultando al Instituto de Botánica de Kunming, Academia de Ciencias de China, se realizaron nuevamente las etiquetas para confirmar la confiabilidad y autenticidad de las especies de piñones.

Los espectros NIR de piñones recolectados se analizaron y se representan en la Fig. 1. Es evidente a partir de todos los espectros NIR originales (Fig. 1a) que la amplitud, los picos y los valles de los espectros NIR de los siete piñones tienen cambios similares. Entre ellos, el valor de P. armandii se encuentra en una posición más alta (que indica el valor de absorbancia más alto) en comparación con todo el rango, y el valor de P. massoniana se encuentra en una posición más baja. Los espectros NIR normalizados (Fig. 1b) muestran que el espectro NIR de cada piñón es más distinto después de la normalización, y los cambios entre los valores de los piñones se pueden observar con mayor claridad. Entre ellos, P. armandii y P. bungeana están muy mezclados en el rango de 9000 a 4000 cm−1 (1111 a 2500 nm).

Datos espectrales NIR de piñones. (a) Todos los espectros NIR originales; (b) Los espectros NIR normalizados, R significa reflectividad y log(1/R) representa absorbancia. Las rayas rectas verticales representan las bandas sensibles en 10 506,29–10 452,29 cm−1, 8712,813–8658,815 cm−1, 5241,572–5187,575 cm−1 y 4489,471–4435,474 cm−1 (951–957 nm, 1147–1154 nm , 1907–1927 nm , 2227–2254 nm) seleccionado moviendo ventanas deslizantes.

Se llevaron a cabo diez análisis independientes sobre datos espectrales NIR normalizados y no normalizados utilizando los cinco modelos tradicionales de aprendizaje automático, es decir, el árbol de decisión (DT), el bosque aleatorio (RF), el perceptrón multicapa (MLP), la máquina de vectores de soporte (SVM) y Naive Bayes (NB) (Tabla 3). Es evidente a partir de la Tabla 3 que la clasificación de los piñones es eficaz utilizando estos modelos. Cuando los datos no están normalizados, la precisión de los modelos de clasificación DT y RF es superior a 0,83. Para datos normalizados, la precisión de clasificación de los cinco modelos es > 0,80, con MLP y SVM proporcionando una precisión > 0,93. Con el preprocesamiento de datos, el rendimiento de los modelos MLP y SVM se ha mejorado considerablemente, la precisión del modelo MLP alcanza el 0,99, mientras que el modelo SVM alcanza el 0,94. En general, estos resultados muestran que el modelo RF es un mejor método de clasificación cuando los datos no están normalizados, mientras que el modelo MLP es el mejor para datos normalizados.

La precisión (Pre) y la puntuación F1 (F1) se presentan en la Tabla 4 (datos no normalizados) y la Tabla 5 (datos normalizados). En la Tabla 4, la precisión y la puntuación F1 de P. armandii y P. bungeana son más altas, y la precisión de P. bungeana es la más alta, alcanzando 0,97. Sin embargo, la precisión y la puntuación F1 de P. taiwanensis y P. massoniana son bastante bajas, alcanzando puntuaciones de precisión del 18 % y el 22 %, respectivamente. En la Fig. 1a, la distinción entre P. armandii y P. bungeana es clara, mientras que P. taiwanensis y P. massoniana son menos distintas y, por lo tanto, más difíciles de clasificar. Sin embargo, la Tabla 5 muestra que la precisión y las puntuaciones F1 de las siete especies de piñones mejoran mucho después de la normalización. Esto indica que la normalización de datos es un paso necesario para el procesamiento de datos espectrales.

Se ejecutaron tres métodos de procesamiento previo para los conjuntos de datos de image_clip (imágenes recortadas), image_trans (imágenes transformadas) e image_gray (imágenes transformadas en escala de grises). Los datos de image_clip se utilizan para explorar los resultados del modelo de aprendizaje profundo en los datos originales, image_trans e image_gray se obtienen al extender la transformación de image_clip. Se seleccionaron los modelos VGG16, VGG19, Xception, ResNet50 e InceptionV3 con las opciones de 100 épocas, y se utilizaron como indicadores de evaluación la precisión y la pérdida. Las Figuras 2, 3 y 4 presentan los valores de precisión y pérdida de los cinco modelos entrenados y verificados. De estas cifras, Xception e InceptionV3 tienen el mejor rendimiento con la mayor precisión y la menor pérdida en comparación con los modelos VGG16, VGG19 y ResNet50. Además, entre los tres métodos de preprocesamiento, image_trans supera a image_gray e image_clip. Por lo tanto, los modelos Xception e InceptionV3 son los más adecuados para la clasificación basada en imágenes de piñones y las imágenes deben transformarse pero no establecerse en escala de grises (Tabla 6).

Precisión y pérdida para cinco modelos diferentes utilizando datos de image_clip.

Precisión y pérdida para cinco modelos diferentes utilizando datos image_trans.

Precisión y pérdida para cinco modelos diferentes utilizando datos image_gray.

Estudios previos han demostrado que el género Pinus se originó a principios del Cretácico (116–83 Mya) y se dividió en dos subgéneros Pinus (P. massoniana, P. thunbergii, P. yunnanensis, P. taiwanensis y P. massoniana, etc.) y Strobus (P. armandii y P. bungeana, etc.)2, 27. Durante la larga historia evolutiva, puede haber experimentado muchos eventos como el movimiento de placas, la transición mar-tierra y cambios climáticos2, 28, 29. La composición química de la planta órganos es el resultado de la interacción entre las plantas y el ambiente en el largo proceso de evolución30,31,32. Nuestros resultados sugirieron que las especies P. armandii y P. bungeana del subgénero Strobus tienen bandas más altas en regiones de 9000 a 4000 cm−1 (1111 a 2500 nm) que otras cinco especies del subgénero Pinus (Fig. 1). Se encontró que estas bandas estaban asociadas con proteínas, aminoácidos, humedad, lípidos y carbohidratos en estudios previos20, 22. En particular, nuestros resultados también mostraron que tres bandas sensibles (1147–1154 nm, 1907–1927 nm, 2227–2254 nm) en estas regiones (1111–2500 nm) tienen una gran influencia en la precisión del modelo basado en el método de ventana deslizante (Fig. 1). A diferencia del subgénero Pinus, las especies P. armandii y P. bungeana del subgénero Strobus se distribuyeron principalmente en el norte de China (Tabla S1). La diferencia de algunas sustancias podría deberse a cierta distribución geográfica y condiciones ambientales como la altitud, la temperatura media anual, las características del suelo, la precipitación y la insolación22. En comparación con estudios previos basados ​​en los métodos SVM, RF y PLS-DA en la clasificación de semillas12, 18, nuestros resultados mostraron que el modelo MLP presentó un rendimiento excelente, lo que podría explicarse porque los espectros NIR recolectados fueron diferentes en sensibilidad al modelo debido a diferentes factores químicos. componentes

También encontramos algunas diferencias morfológicas entre dos subgéneros en imágenes de piñones. Las semillas del subgénero Strobus probablemente tengan una forma y textura más suaves que las del subgénero Pinus (Fig. 7), lo que sería propicio para la extracción de características del modelo de aprendizaje automático. Estudios previos han demostrado que los modelos PLS-DA e IPLS-DA lograron buenos resultados para reconocer las múltiples variedades de dos especies22. Sin embargo, nuestros resultados sugirieron que el modelo InceptionV3 funcionó mejor en las imágenes de piñones de siete especies con la mayor velocidad de convergencia y la mayor precisión. Se encontró que el modelo similar se usa con éxito para el diagnóstico de deficiencias de nutrientes en el arroz33 y la clasificación de múltiples especies de malezas34. La diferente precisión de reconocimiento de múltiples modelos puede estar relacionada con las características morfológicas (forma, color y textura) de las nueces entre conjuntos de datos.

Existen diferentes ventajas en tres métodos de reconocimiento de marcadores moleculares, NIR e imágenes (Fig. 5). En términos de precisión, los marcadores moleculares tienen tasas de reconocimiento más altas que NIR e imágenes. Sin embargo, el etiquetado molecular lleva mucho tiempo, además de estar limitado por equipos experimentales y bases de datos de referencia pública. En términos de costo, el análisis de imágenes puede ser mejor porque es conveniente, rápido y libre de restricciones ambientales, pero este método requiere una gran cantidad de imágenes y tiene una tasa de reconocimiento más baja. En términos de rendimiento, la espectroscopia NIR puede ser mejor debido a su mayor tasa de reconocimiento y menor cantidad de datos generados, pero es costosa y requiere dispositivos especiales. En el futuro, aprovecharíamos el enfoque de aprendizaje por conjuntos fusionando múltiples funciones de moléculas, NIR e imágenes para más especies.

Gráfico radial de costes analíticos, complejidad y rendimiento. Tiempo: el tiempo requerido para los análisis; Costo: el costo financiero de completar los análisis; Limitación: el grado de factores limitantes de las condiciones experimentales; Capacidad de datos: la cantidad de datos obtenidos de los análisis; Exactitud: la exactitud de la identificación. La escala aquí representa el valor con 0 indicando el valor más bajo y 1.0 indicando el valor más alto.

Con base en los hallazgos del presente estudio, este estudio verifica la aplicación potencial de modelos de aprendizaje automático basados ​​en espectroscopía NIR e imágenes para el reconocimiento entre diferentes especies de piñones. Recolectamos siete especies de piñones como objeto de investigación, construimos modelos de clasificación basados ​​en espectroscopía NIR y datos de imágenes. En comparación con diferentes modelos, se demostró que MLP e InceptionV3 logran un mejor efecto de clasificación. Al mismo tiempo, las bandas sensibles de NIR muestran la correlación con algunas vibraciones moleculares especiales de grupos funcionales. Los resultados aportarán soluciones y métodos científicos para la clasificación cómoda, rápida y no destructiva de diferentes especies de piñones, y aportarán una nueva idea en el campo de la clasificación de especies, así como un esquema metodológico y técnico de referencia.

El permiso académico para recolectar y estudiar piñones fue otorgado por el director del Laboratorio Clave de Conservación y Utilización de Recursos Forestales de las Montañas del Suroeste, Ministerio de Educación, Universidad Forestal del Suroeste. El estudio cumplió con todas las directrices pertinentes.

Utilizado en el estudio de P. bungeana | Junying Jiao 01 |, P. armandii | Instituto de Botánica de Kunming, Academia de Ciencias de China, ZuoZh271 |, P. yunnanensis | Instituto de Botánica de Kunming, Academia de Ciencias de China, MY259|, P. thunbergia | Instituto de Botánica de Kunming, Academia de Ciencias de China, Lilan898 |, P. massoniana | Instituto de Botánica de Kunming, Academia de Ciencias de China, LWY2020020 |, P. elliottii | Junying Jiao 02 |y P. taiwanensis | Instituto de Botánica de Kunming, Academia China de Ciencias, Jiangxc0597 | se prepararon a partir del Instituto de Botánica de Kunming, la Academia de Ciencias de China y las plantas de preparación de estaciones de trabajo de plántulas del bosque de Yunnan. Los piñones utilizados en el estudio fueron identificados formalmente por Junying Jiao, director del Laboratorio Clave de Conservación y Utilización de Recursos Forestales en la Región Montañosa del Suroeste del Ministerio de Educación, Facultad de Silvicultura, Universidad Forestal del Suroeste. P. bungeana y P. elliottii fueron registradas y preservadas en el herbario de Southwest Forestry University, con número de acceso de código: 0000651 y 0,000,652. P. armandi, P. yunnanensis, P. thunbergia, P. massoniana y P. taiwanensis se registraron y conservaron en el Banco de Germoplasma del Instituto de Botánica de Kunming, Academia de Ciencias de China, con número de acceso de código: ZuoZh271, MY259, Lilan898, LWY2020020 y Jiangxc0597.

Se seleccionaron aproximadamente 1,5 kg de nueces de cada especie y se sometieron a un pretratamiento para análisis de imagen y espectroscopia NIR. La superficie de la semilla se enjuagó con agua destilada y se eliminaron las nueces defectuosas. A continuación, los piñones limpios se secaron en un horno (Modelo DHG-9245A, Shanghai Hengke Instrument Co., Ltd., Shanghai, China) a 40 °C durante 8 h. Después del preprocesamiento, las nueces se dividieron aleatoriamente en 30 grupos para la posterior adquisición de espectros NIR. Se fotografiaron uno o dos frutos secos de cada grupo para obtener las imágenes de origen (Cuadro 7).

Para identificar las especies de piñones se diseñaron los cebadores de ITS2 y rbcL en base a las secuencias conocidas en un estudio previo35 (Tabla 8). Los genes del fragmento se localizaron y secuenciaron utilizando un secuenciador ABI 3730. Se utilizó la herramienta SeqMan para ensamblar los fragmentos superpuestos.

Los espectros NIR se adquirieron con el espectrómetro Antaris Fourier Transform NIR (Thermo Fisher Scientific, Massachusetts, EE. UU.) equipado con un detector de InGaAs con esfera de integración difusa, una copa de muestreo de cuarzo de 7,78 cm y una mesa giratoria de muestra dentro del rango de 12.800 a 3.800 cm− 1 (781 nm-2632 nm) a una resolución de 8 cm−1. Las muestras se escanearon 48 veces y se obtuvieron 2335 bandas. Los datos se transformaron usando log(1/R) para representar la absorbancia.

Los espectros NIR se normalizaron utilizando un método de normalización mínimo-máximo para eliminar los efectos adversos causados ​​por los valores atípicos. Los datos originales se normalizaron al rango de 0 y 1 utilizando la ecuación. (1).

donde x representa los valores de absorbancia, min(x) y max(x) representan los valores de absorbancia más bajos y más altos, respectivamente.

Las imágenes de piñones fueron capturadas usando un microscopio LEICA EZ4 con fondo blanco y ocho aumentos a través de un teléfono móvil Huawei Mate 30 con una cámara ultrasensible de 40 MP (gran angular, f/1.8) que admite enfoque automático y enfoque manual. El ángulo de disparo se fijó en 90°, la altura en 50 cm y se tomaron 52 imágenes por cada especie de piñón.

Durante el proceso de captura de imágenes, surgen irregularidades. Estos incluyen la variación de tamaño de los piñones, las posiciones inconsistentes y la apariencia del color, todo lo cual afectará los modelos de reconocimiento y la precisión de la clasificación. Por lo tanto, el preprocesamiento de imágenes para la estandarización implicó los siguientes dos pasos:

(1) Detección de bordes y recorte

La posición del borde de los piñones se detectó con el método Sobel en la plataforma OpenCV. Una vez que se definieron los vértices superior, inferior, izquierdo y derecho de la semilla, la imagen se recortó a través de un marco de matriz que conectaba los cuatro vértices (Fig. 6). Para mantener un fondo de imagen uniforme (Fig. 6d), a veces fue necesario realizar más cortes manuales (Fig. 6e).

Proceso de recorte y detección de bordes de Sobel.

(2) Aumento de datos e imagen en escala de grises

Las imágenes recortadas se orientaron utilizando las funciones 'voltear' y 'cambiar el tamaño' en OpenCV. Se utilizó la fórmula (2) para transformar estas imágenes alineadas en imágenes en escala de grises (Fig. 7). En este estudio se utilizó la función de conversión de color de OpenCV: CV_BGR2GRAY para realizar el procesamiento de imágenes en escala de grises.

Resultados del preprocesado de imágenes para piñones de cada especie. Las imágenes se han recortado, volteado, redimensionado y transformado el color a escala de grises.

Para estudiar más a fondo el modelo de clasificación de piñones, se emplearon dos enfoques experimentales (Fig. 8). Para el primer enfoque, se utilizaron métodos tradicionales de aprendizaje automático, como DT, RF, MLP, SVM y NB, que se utilizaron para clasificar las nueces en función de la espectroscopia NIR. El modelo de clasificación basado en espectros NIR incluye cinco pasos (Fig. 8a). Primero se prepararon los datos y luego se dividieron en un conjunto de entrenamiento y un conjunto de validación de acuerdo con la proporción de 8:2. Luego se utilizaron los métodos de aprendizaje DT, RF, MLP, SVM y NB para establecer modelos de clasificación. Luego del entrenamiento y la validación, se seleccionaron la precisión (Acc), Pre y F1 como indicadores de evaluación del desempeño de cada modelo de clasificación.

Proceso de diseño experimental para reconocimiento de imágenes y espectroscopia NIR. ( a ) Proceso de establecimiento del modelo de clasificación de aprendizaje automático tradicional utilizando datos de espectroscopia NIR. (b) Proceso de establecimiento del modelo de clasificación de aprendizaje profundo utilizando datos de imagen.

El segundo enfoque, se construyeron y entrenaron cinco modelos CNN (VGG16, VGG19, Xception, InceptionV3 y ResNet50) para clasificar las imágenes de piñones (Fig. 8b). Primero, las imágenes originales en el conjunto de datos eran de diferentes tamaños. Antes del experimento, las imágenes originales se preprocesaron y luego se cortaron en tamaños de 224 × 224. En segundo lugar, las imágenes de piñones se dividieron en un conjunto de entrenamiento y un conjunto de validación de acuerdo con la proporción de 8:2. Luego, los modelos VGG16, VGG19, Xception, ResNet50 e InceptionV3 fueron cargados en la plataforma experimental para entrenamiento y validación. Las épocas se establecieron en 100 veces, se adoptó el método de optimización Stochastic Gradient Descent (SGD) y la tasa de aprendizaje inicial se estableció en 0,005. La tasa de aprendizaje cambia con los giros de entrenamiento, con una atenuación de 1e-6 por giro, y el parámetro de momento se fijó en 0,9. La función de pérdida fue sparse_categorical_crossentropy, y la función de activación fue Rectified Linear Units (ReLU). Finalmente, se seleccionaron Acc, Pre y F1 para la evaluación del modelo.

Estos dos enfoques experimentales fueron diseñados para comparar y analizar el rendimiento de diferentes modelos para evaluar cuál serviría mejor para futuras investigaciones de clasificación de piñones. Los modelos de CNN se crearon con las bibliotecas de Python Keras-nightly 2.6.0, TensorFlow-nightly-GPU 2.6.0 y Scikit-learn 0.24.2 ejecutadas en Python v.3.7.

Los datos y códigos presentados en este estudio están disponibles en https://github.com/SWFU-JiangLiu/Recognition-of-pine-nuts.git. Los números de acceso de GenBank son OK271114-OK271122 y OK274058-OK274066.

Gernandt, DS, Lopez, GG, Garcia, SO & Liston, A. Filogenia y clasificación de Pinus. Taxón 54, 29–42 (2005).

Artículo Google Académico

Jin, WT et al. Los análisis filogenómicos y ecológicos revelan la evolución espaciotemporal de los pinos globales. proc. nacional Academia ciencia EE. UU. https://doi.org/10.1073/pnas.2022302118 (2021).

Artículo PubMed PubMed Central Google Académico

Wang, Y. Frutos secos nutritivos y piñones. Shanxi viejo 58, 58 (2016).

Guo, X. Piñones de invierno para eliminar enfermedades. Reverdecimiento y Vida 44, 44 (2014).

Zhu, D. et al. La identificación de una sola variedad de semilla de soja mediante imágenes de retrodispersión de luz láser. Sens. Lett. 10, 399–404 (2012).

Artículo Google Académico

Zhang, C. et al. Aplicación de marcadores SSR para pruebas de pureza de soja híbrida comercial (Glycine max L.). J. Agric. ciencia Tecnología 16, 1389–1396 (2014).

Google Académico

Iqbal, A., Sadaqat, HA, Khan, AS & Amjad, M. Identificación de híbridos de girasol (Helianthus annuus, Asteraceae) utilizando marcadores repetidos de secuencia simple. Gineta. mol. Res. 10, 102–106. https://doi.org/10.4238/vol10-1gmr918 (2011).

Artículo CAS PubMed Google Académico

Oliveira de Oliveira, L. et al. Marcadores moleculares en Carya illinoinensis (Juglandaceae): desde la caracterización genética hasta el mejoramiento molecular. J. Hortic. ciencia Biotecnología. 96, 560–569. https://doi.org/10.1080/14620316.2021.1892534 (2021).

Artículo CAS Google Académico

Pandit, R., Travadi, T., Sharma, S., Joshi, C. & Joshi, M. El metacódigo de barras de ADN usando un minicódigo de barras basado en rbcL reveló la presencia de especies de plantas no especificadas en formulaciones de poliherbas ayurvédicas. Fitoquímica. Anal. 32, 804–810. https://doi.org/10.1002/pca.3026 (2021).

Artículo CAS PubMed Google Académico

Rao, P. et al. Identificación varietal en arroz (Oryza sativa) mediante ensayos químicos y electroforesis en gel de proteínas solubles de semilla. Indio J. Agric. ciencia 82, 304–311 (2012).

CAS Google Académico

Peng, Z. et al. Aplicación de la cromatografía líquida de alta resolución desnaturalizante para la identificación de variedades de arroz y la evaluación de la pureza de las semillas. mol. Criar. https://doi.org/10.1007/s11032-015-0429-8 (2016).

Artículo Google Académico

Kong, W., Zhang, C., Liu, F., Nie, P. & He, Y. Identificación de cultivares de semillas de arroz utilizando imágenes hiperespectrales de infrarrojo cercano y análisis de datos multivariados. Sensores (Basilea) 13, 8916–8927. https://doi.org/10.3390/s130708916 (2013).

Artículo ANUNCIOS Google Académico

Yang, X., Hong, H., You, Z. y Cheng, F. Análisis espectral e integrado de imágenes de datos hiperespectrales para la clasificación de variedades de semillas de maíz ceroso. Sensores (Basilea) 15, 15578–15594. https://doi.org/10.3390/s150715578 (2015).

Artículo ANUNCIOS Google Académico

Liu, J., Li, Z., Hu, F., Chen, T. & Zhu, A. Un método de identificación no destructivo de espectroscopia THz para semillas de algodón transgénico basado en GA-SVM. Optar. cuant. Electrón. 47, 313–322. https://doi.org/10.1007/s11082-014-9914-2 (2014).

Artículo CAS Google Académico

Pourreza, A., Pourreza, H., Abbaspour-Fard, M.-H. & Sadrnia, H. Identificación de nueve variedades de semillas de trigo iraníes mediante análisis textural con procesamiento de imágenes. computar Electrón. agricola 83, 102–108. https://doi.org/10.1016/j.compag.2012.02.005 (2012).

Artículo Google Académico

Boelt, B. et al. Imágenes multiespectrales: ¿una nueva herramienta en la evaluación de la calidad de las semillas? ciencia de semillas Res. 28, 222–228. https://doi.org/10.1017/s0960258518000235 (2018).

Artículo Google Académico

Kandala, CVK, Govindarajan, KN, Puppala, N., Settaluri, V. & Reddy, RS Identificación de variedades de trigo con un sensor de capacitancia de placas paralelas utilizando el análisis discriminante lineal de Fisher. J. Sens. 1–5, 2014. https://doi.org/10.1155/2014/691898 (2014).

Artículo Google Académico

Zhu, S. et al. Un método rápido y altamente eficiente para la identificación de variedades de semillas de soja: imágenes hiperespectrales combinadas con aprendizaje de transferencia. Moléculas 25, 152. https://doi.org/10.3390/molecules25010152 (2019).

Artículo CAS PubMed Central Google Académico

ElMasry, G. et al. Utilización de técnicas de visión por computadora y de imágenes multiespectrales para la clasificación de semillas de caupí (Vigna unguiculata). Plant Methods 15, 24. https://doi.org/10.1186/s13007-019-0411-2 (2019).

Artículo PubMed PubMed Central Google Académico

Tigabu, M., Oden, PC y Lindgren, D. Identificación de fuentes de semillas y progenitores de Pinus sylvestris L. utilizando espectros de reflectancia visible-infrarrojo cercano y análisis multivariante. Árboles 19, 468–476. https://doi.org/10.1007/s00468-005-0408-5 (2005).

Artículo Google Académico

Loewe Munoz, V., Balzarini, M., Delard Rodriguez, C., Alvarez Contreras, A. & Navarro-Cerrillo, RM Crecimiento de pino piñonero (Pinus pinea L.) de procedencia europea en Chile central. iForest Biogeosci. Para. 10 , 64–6 https://doi.org/10.3832/ifor1984-009 (2017).

Artículo Google Académico

Moscetti, R. et al. Reconocimiento de especies de piñones mediante espectroscopía NIR y análisis de imágenes. J. Ing. de Alimentos. 292, 110357. https://doi.org/10.1016/j.jfoodeng.2020.110357 (2021).

Artículo CAS Google Académico

Shi, J., Liu, Z., Zhang, L., Zhou, W. y Huang, J. Reconocimiento hiperespectral del arroz dañado por la máquina de vector de soporte 013 basada en el rodillo de hoja de arroz. Mentón. J. Arroz Sci. 23, 331–334 (2009).

CAS Google Académico

Xu, Z. et al. Detección de daños por andador de Dendrolimus punctatus basada en análisis discriminante de pescadores y bosque aleatorio. Espectrosc. Anal espectral. 38, 2888–2896 (2018).

CAS Google Académico

Rangarajan, AK, Purushothaman, R. & Ramesh, A. Clasificación de enfermedades de cultivos de tomate utilizando un algoritmo de aprendizaje profundo preentrenado. Cómputo de procedimientos. ciencia 133, 1040–1047 (2018).

Artículo Google Académico

Hridayami, P., Putra, IKGD y Wibawa, KS Reconocimiento de especies de peces mediante la red neuronal convolucional profunda VGG16. J. Cómputo. ciencia Ing. 13, 124–130. https://doi.org/10.5626/jcse.2019.13.3.124 (2019).

Artículo Google Académico

Zhao, YJ, Cao, Y., Wang, J. y Xiong, Z. Secuenciación del transcriptoma de Pinus kesiya var. langbianensis y análisis comparativo en la filogenia de Pinus. BMC Genomics 19, 725. https://doi.org/10.1186/s12864-018-5127-6 (2018).

Artículo CAS PubMed PubMed Central Google Scholar

Herold, N., You, Y., Müller, RD y Seton, M. Sensibilidad del modelo climático a los cambios en la paleotopografía del Mioceno. Austral. J. Ciencias de la Tierra. 56, 1049–1059. https://doi.org/10.1080/08120090903246170 (2009).

Artículo ADS CAS Google Académico

Golonka, J. et al. Reconstrucciones paleogeográficas y desarrollo de cuencas del Ártico. mascota de mar. Geol. 20, 211–248. https://doi.org/10.1016/s0264-8172(03)00043-6 (2003).

Artículo Google Académico

Fidan, H. et al. Composición química de Pinus nigra Arn. semillas inmaduras de Bulgaria. Plantas https://doi.org/10.3390/plants11030245 (2022).

Artículo PubMed PubMed Central Google Académico

Sahin, U., Anapali, O. & Ercisli, S. Propiedades fisicoquímicas de algunos sustratos utilizados en horticultura. EUR. J. Hortic. ciencia 67, 55–60 (2002).

CAS Google Académico

Liu, W. et al. Influencia de factores ambientales en la producción de principios activos y actividad antioxidante en Potentilla fruticosa L. y su evaluación de calidad. ciencia Rep. 6, 28591. https://doi.org/10.1038/srep28591 (2016).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Xu, Z. et al. Uso de redes neuronales convolucionales profundas para el diagnóstico basado en imágenes de las deficiencias de nutrientes en el arroz. computar Intel. Neurosci. 2020, 7307252. https://doi.org/10.1155/2020/7307252 (2020).

Artículo PubMed PubMed Central Google Académico

Olsen, A. et al. DeepWeeds: un conjunto de datos de imágenes de especies de malezas multiclase para el aprendizaje profundo. ciencia Rep. 9, 2058. https://doi.org/10.1038/s41598-018-38343-3 (2019).

Artículo ADS CAS PubMed PubMed Central Google Scholar

Gong, H. et al. Identificación microscópica y molecular de agujas de pino. J. Universidad de Zhejiang. (Med. Sci.) 47, 300–306 (2018).

Google Académico

Descargar referencias

Este trabajo cuenta con el apoyo de Yunnan Zhuoyao Technology Company.

Este trabajo fue apoyado por proyectos de la Fundación Nacional de Ciencias Naturales (31960142); Laboratorio clave para la conservación y utilización de recursos forestales en las montañas del suroeste de China, Ministerio de Educación (KLESWFU-201905), Fundación de Investigación Científica del Departamento de Educación de Yunnan (2022Y559) y Digitalización, desarrollo y aplicación de recursos bióticos (202002AA10007).

Estos autores contribuyeron por igual: Biaosheng Huang y Jiang Liu.

Facultad de Big Data e Ingeniería Inteligente, Universidad Forestal del Suroeste, Kunming, 650224, Yunnan, China

Biaosheng Huang, Jiang Liu, Jing Lu, Danjv Lv, Jiawei Mao y Youjie Zhao

Laboratorio Clave para la Conservación y Utilización de Recursos Forestales en las Montañas del Suroeste de China, Ministerio de Educación, Universidad Forestal del Suroeste, Kunming, 650224, Yunnan, China

Biaosheng Huang y Youjie Zhao

Facultad de silvicultura, Universidad de silvicultura del suroeste, Kunming, 650224, Yunnan, China

Junying Jiao

Facultad de Matemáticas y Física, Universidad Forestal del Suroeste, Kunming, 650224, Yunnan, China

yan zhang

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

También puede buscar este autor en PubMed Google Scholar

BSH y JL (Jiang Liu) diseñaron este estudio y escribieron el texto principal del manuscrito. JYJ compró y guardó los piñones. JL (Jing Lu) y JWM recolectaron los datos, analizaron los datos y prepararon las cifras. YJZ y YZ ayudaron a interpretar los resultados. DJL, YJZ e YZ ayudaron a editar el idioma. Todos los autores contribuyeron a la interpretación de los resultados y la redacción del manuscrito.

Correspondencia a Youjie Zhao o Yan Zhang.

Los autores declaran no tener conflictos de intereses.

Springer Nature se mantiene neutral con respecto a los reclamos jurisdiccionales en mapas publicados y afiliaciones institucionales.

Acceso abierto Este artículo tiene una licencia internacional Creative Commons Attribution 4.0, que permite el uso, el intercambio, la adaptación, la distribución y la reproducción en cualquier medio o formato, siempre que se otorgue el crédito correspondiente al autor o autores originales y a la fuente. proporcionar un enlace a la licencia Creative Commons e indicar si se realizaron cambios. Las imágenes u otro material de terceros en este artículo están incluidos en la licencia Creative Commons del artículo, a menos que se indique lo contrario en una línea de crédito al material. Si el material no está incluido en la licencia Creative Commons del artículo y su uso previsto no está permitido por la regulación legal o excede el uso permitido, deberá obtener el permiso directamente del titular de los derechos de autor. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by/4.0/.

Reimpresiones y permisos

Huang, B., Liu, J., Jiao, J. y col. Aplicaciones del aprendizaje automático en la clasificación de piñones. Informe científico 12, 8799 (2022). https://doi.org/10.1038/s41598-022-12754-9

Descargar cita

Recibido: 18 noviembre 2021

Aceptado: 16 mayo 2022

Publicado: 25 mayo 2022

DOI: https://doi.org/10.1038/s41598-022-12754-9

Cualquier persona con la que compartas el siguiente enlace podrá leer este contenido:

Lo sentimos, un enlace para compartir no está disponible actualmente para este artículo.

Proporcionado por la iniciativa de intercambio de contenido Springer Nature SharedIt

Métodos analíticos de alimentos (2023)

Al enviar un comentario, acepta cumplir con nuestros Términos y Pautas de la comunidad. Si encuentra algo abusivo o que no cumple con nuestros términos o pautas, márquelo como inapropiado.

COMPARTIR