Компания Gigabyte объявила о выпуске новой компактной видеокарты GTX 970, которая получила номер..
Для построения модели авторы применили методы машинного обучения, в частности — cамоорганизующиеся карты Кохонена
© Дмитрий Феоктистов/ТАСС
МОСКВА, 16 февраля. /Корр. ТАСС Александра Борисова/. Ученые из МФТИ и МГУ под руководством Яна Иваненкова впервые разработали компьютерную модель, позволяющую предсказывать агрохимическую активность — наличие полезного воздействия на растения — простых молекул. С использованием независимого тестового набора и результатов собственного исследования было показано, что модель обладает высокой предсказательной способностью. Работа опубликована
Построенная модель Кохонена: зеленый градиент на заднем фоне соответствует молекулам — активаторам роста растений из обучающей выборки, более темные области заселены большим количеством молекул. Кружками показаны молекулы из тестового (экспериментального) набора. Видно, что большинство протестированных молекул лежит в темных областях, что свидетельствует о высокой предсказательной способности модели.
© Bushkov et. al./Phytochemistry
«
Дибензазепин — регулятор роста растений, одна из молекул, правильно классифицированная моделью
© Bushkov et. al./Phytochemistry
С использованием алгоритма Кохонена без учителя можно уменьшить размерность этих данных с наименьшей ошибкой (этот этап назвается обучением алгоритма) и визуализировать результат в виде удобной для анализа двумерной карты, на которой можно поочередно выделить области, занимаемые молекулами из различных категорий. Тогда по этой карте можно оценить классификационную способность модели. Если эта способность в высока (например, для подобных масштабных задач это больше 70%), то модель можно протестировать с использованием независимого тестового набора молекул, которые не принимали участие в обучении. Именно это и сделали авторы работы, наглядно продемонстрировав, что их модель способна прогнозировать специфическую активность новых молекул, относя их к одной из общепринятых категорий: гербициды, регуляторы роста растений и т.п.
В будущем подобные вычислительные модели позволят значительно удешевить поиск новых активных молекул и внесут свой вклад в понимание механизмов их действия.