Определение количественного содержания хлорофиллов в листьях по спектрам отражения алгоритмом случайного леса

E. A. Urbanovich, D. A. Afonnikov, S. V. Nikolaev

Результат исследования: Научные публикации в периодических изданияхстатьярецензирование

Аннотация

Определение количественного содержания хлорофиллов в листьях растений по их спектрам отражения - важная задача как при мониторинге состояния естественных и промышленных фитоценозов, так и в лабораторных исследованиях нормальных и патологических процессов в ходе роста растения. Применение для этих целей методов машинного обучения является перспективным, поскольку они позволяют «автоматически» строить решающие правила для получения результата (модель предсказания), а исследователю (для повышения качества предсказания) остаются модификация предикторов и выбор множества параметров метода. В статье приведены результаты построения решающих правил алгоритмом случайного леса (random forest) для предсказания суммарной концентрации хлорофиллов a и b по спектрам отражения листьев растений в видимом и инфракрасном (ИК) диапазонах длин волн. Набор данных взят из открытых источников. Они включали 276 образцов листьев 39 видов растений. При этом 181 образец получен при анализе листьев белого клена ( Acer pseudoplatanus L.). Спектр отражения представлен в диапазоне 400-2500 нм с шагом 1 нм. Обучение происходило на 85 % образцов A. pseudoplatanus L., оценка качества предсказания - на оставшихся 15 % образцов этого вида (валидационная выборка). Построено шесть моделей на основе алгоритма случайного леса с разными предикторами. Подбор управляющих параметров осуществляли при помощи перекрестной проверки на пяти разбиениях. Предикторами первой модели выступали имеющиеся значения по спектру отражения без какой-либо обработки с нашей стороны. После проведения анализа этой модели были выбраны диапазоны длин волн предикторов для оставшихся пяти моделей. Лучшие предсказания имеют модели с разностной производной спектра отражения в видимом диапазоне длин волн. Модель с первой производной спектра отражения в диапазоне 400-800 нм с шагом 1 нм брали для сравнения с моделью других авторов. Этой моделью выступает функциональная зависимость с двумя неизвестными параметрами, подбираемыми методом наименьших квадратов и двумя коэффициентами отражения, выбор которых описывается в настоящей статье. Сравнение результатов предсказаний модели с применением алгоритма случайного леса проводили как на валидационной выборке клена, так и на выборке из других видов растений. В первом случае предсказания метода на основе случайного леса имели меньшую оценку среднеквадратического отклонения. Во втором случае предсказания этого метода были с большой ошибкой при малых значениях хлорофилла, в то время как сторонний метод имел приемлемые предсказания. В статье приводятся анализ результатов и рекомендации по применению этого метода машинного обучения для оценки количественного содержания хлорофиллов в листьях.
Переведенное названиеDetermination of the quantitative content of chlorophylls in leaves by ref lection spectra using the random forest algorithm
Язык оригиналарусский
Номер статьи7
Страницы (с-по)64-70
Число страниц7
ЖурналVavilovskii Zhurnal Genetiki i Selektsii
Том25
Номер выпуска1
DOI
СостояниеОпубликовано - 2021

Предметные области OECD FOS+WOS

  • 1.06 БИОЛОГИЧЕСКИЕ НАУКИ
  • 4.01 СЕЛЬСКОЕ ХОЗЯЙСТВО, ЛЕСОНОЕ ХОЗЯЙСТВО, РЫБНОЕ ХОЗЯЙСТВО
  • 1.06.KM ГЕНЕТИКА И НАСЛЕДСТВЕННОСТЬ

ГРНТИ

  • 34.23.57 Генетика возделываемых растений и лесных пород

Fingerprint Подробные сведения о темах исследования «Определение количественного содержания хлорофиллов в листьях по спектрам отражения алгоритмом случайного леса». Вместе они формируют уникальный семантический отпечаток (fingerprint).

Цитировать