В РФ разработали нейросеть для обработки данных рентгеновской спектроскопии
10 декабря 2024
Модель глубокого машинного обучения для автоматической обработки спектров рентгеновской фотоэлектронной спектроскопии (РФЭС), применяемой в химии и материаловедении, разработали в Новосибирском государственном университете (НГУ). Нейросеть позволит исследователям многократно сэкономить время при обработке данных, сообщили ТАСС в пресс-службе вуза.
РФЭС - метод исследования элементного состава, химического и электронного состояния атомов на поверхности изучаемого материала, основанный на явлении внешнего фотоэффекта. Спектры получают путем облучения материала пучком рентгеновских лучей с регистрацией зависимости количества испускаемых электронов от их энергии связи. Этот метод является одним из самых распространенных спектроскопических методов в катализе, материаловедении, физике полупроводников и многих других областях современной науки.
"С открытием центра коллективного пользования "Сибирский кольцевой источник фотонов" объем данных значительно увеличится, а инструментов для их автоматической обработки до сих пор нет. И мы решили впервые доверить решение этой проблемы нейросетям. Для обучения модели мы использовали синтетические данные. Каждый такой синтетический спектр включал в себя шум, пики и фон неупругого рассеяния. Затем мы разработали алгоритм для постобработки результатов анализа модели", - цитирует автора разработки Артема Вахрушева пресс-служба НГУ.
В качестве данных для проверки модели и алгоритмов постобработки использовались спектры хлорида серебра, полученные научной группой в Институте катализа имени Г. К. Борескова СО РАН. В результате исследований выяснилось, что разработанный подход, сочетающий в себе сегментацию спектров нейросетью и алгоритмов постобработки, хорошо согласуется с результатами ручного анализа.
Архитектура модели, обучение и тестирование созданы с использованием инструмента для создания нейросетей PyTorch на языке программирования Python. Процесс обработки спектра занимает менее секунды на домашнем ноутбуке. В том время как обычная обработка данных ведется в ручную и представляет собой рутинный процесс - на описание одного спектра у научного сотрудника уходит порядка 10 минут.
Для более удобного использования нейросети Вахрушев уже приступил к разработке ее графического интерфейса. Также он планирует создать потоковую обработку большого количества спектров, чтобы программа могла выводить динамику изменения состава исследуемой поверхности.
По материалам сайта ТАСС