Российский университет медицины

Проект кафедры истории медицины Российского университета медицины

В РФ разработали нейросеть для обработки данных рентгеновской спектроскопии

10 декабря 2024

Модель глубокого машинного обучения для автоматической обработки спектров рентгеновской фотоэлектронной спектроскопии (РФЭС), применяемой в химии и материаловедении, разработали в Новосибирском государственном университете (НГУ). Нейросеть позволит исследователям многократно сэкономить время при обработке данных, сообщили ТАСС в пресс-службе вуза.

РФЭС - метод исследования элементного состава, химического и электронного состояния атомов на поверхности изучаемого материала, основанный на явлении внешнего фотоэффекта. Спектры получают путем облучения материала пучком рентгеновских лучей с регистрацией зависимости количества испускаемых электронов от их энергии связи. Этот метод является одним из самых распространенных спектроскопических методов в катализе, материаловедении, физике полупроводников и многих других областях современной науки.

"С открытием центра коллективного пользования "Сибирский кольцевой источник фотонов" объем данных значительно увеличится, а инструментов для их автоматической обработки до сих пор нет. И мы решили впервые доверить решение этой проблемы нейросетям. Для обучения модели мы использовали синтетические данные. Каждый такой синтетический спектр включал в себя шум, пики и фон неупругого рассеяния. Затем мы разработали алгоритм для постобработки результатов анализа модели", - цитирует автора разработки Артема Вахрушева пресс-служба НГУ.

В качестве данных для проверки модели и алгоритмов постобработки использовались спектры хлорида серебра, полученные научной группой в Институте катализа имени Г. К. Борескова СО РАН. В результате исследований выяснилось, что разработанный подход, сочетающий в себе сегментацию спектров нейросетью и алгоритмов постобработки, хорошо согласуется с результатами ручного анализа.

Архитектура модели, обучение и тестирование созданы с использованием инструмента для создания нейросетей PyTorch на языке программирования Python. Процесс обработки спектра занимает менее секунды на домашнем ноутбуке. В том время как обычная обработка данных ведется в ручную и представляет собой рутинный процесс - на описание одного спектра у научного сотрудника уходит порядка 10 минут.

Для более удобного использования нейросети Вахрушев уже приступил к разработке ее графического интерфейса. Также он планирует создать потоковую обработку большого количества спектров, чтобы программа могла выводить динамику изменения состава исследуемой поверхности.

По материалам сайта ТАСС