Вчені звернули увагу на успіхи ШІ в настільних іграх, що надихнуло їх на таку ідею
У новому дослідженні вчені показали, як глибоке навчання з підкріпленням можна використовувати для розробки більш ефективних ядерних реакторів. На це їх надихнули успіхи штучного інтелекту (ШІ) в настільних іграх, пише SciencedDirect.
Зараз ядерна енергія дає більше безвуглецевої електроенергії в США, ніж сонячна і вітрова разом узяті. Це робить її ключовим гравцем у боротьбі зі зміною клімату. Однак методи її видобутку недосконалі та застарівають. Необхідно оптимізувати процес, щоб ядерна енергетика могла конкурувати з вугільними та газовими електростанціями на ринку.
Скоротити витрати на видобуток можна, оптимізувавши паливні стрижні на глибині ядерного реактора. Вони запускають реакції й, коли розташовані ідеально, спалюють менше палива та вимагають менше обслуговування.
Через десятиліття проб і помилок інженери-ядерники навчилися розробляти більш досконалі схеми розташування дорогих паливних стрижнів, щоб продовжити їх термін служби. Тепер їм допоможе штучний інтелект.
Дослідники з Массачусетського технологічного інституту (MIT) і Exelon впевнені — перетворивши процес проєктування в гру, систему ШІ можна навчити генерувати десятки оптимальних конфігурацій стрижнів, які можуть продовжити термін служби кожного з них приблизно на 5%.
Це дозволяє заощадити на типовій електростанції близько $3 млн на рік. Система штучного інтелекту може знаходити оптимальні рішення швидше, ніж людина, і швидко змінювати конструкції в безпечному змодельованому середовищі.
“Ця технологія може бути застосована до будь-якого ядерного реактора у світі, — пояснює старший автор дослідження доцент кафедри ядерної науки та техніки Массачусетського технологічного інституту Коріш Ширван. — Поліпшивши економіку ядерної енергетики, яка забезпечує 20% електроенергії, виробленої в США, ми можемо допомогти обмежити зростання глобальних викидів вуглецю і залучити кращі молоді таланти в цей важливий сектор екологічно чистої енергії”.
У типовому реакторі паливні стрижні збудовані в сітку або збірку за рівнями урану та оксиду гадолінію всередині, як шахові фігури на дошці, з реакціями, що запускають радіоактивний уран, і рідкоземельний гадоліній, що уповільнює їх. В ідеальному компонуванні ці конкуруючі імпульси врівноважуються, щоб стимулювати ефективні реакції. Інженери намагалися використовувати традиційні алгоритми для поліпшення макетів, розроблених людиною, але в стандартній зборці зі 100 стрижнів може бути астрономічна кількість варіантів для оцінки.
Дослідники поставили собі питання, чи може глибоке навчання з підкріпленням — техніка штучного інтелекту, що дозволяє досягати надлюдської майстерності в таких іграх, як шахи та го, — прискорити процес перевірки. Глибоке навчання з підкріпленням поєднує в собі глибокі нейронні мережі, які чудово виділяють закономірності в масивах даних, з навчанням з підкріпленням, яке пов’язує навчання з сигналом винагороди, таким як перемога в грі.
У новому експерименті дослідники навчили свого агента розміщувати паливні стрижні відповідно до набору обмежень, заробляючи більше очок за кожен вдалий хід. Кожне обмеження або правило, обране дослідниками, зображає десятиліття експертних знань, заснованих на законах фізики. Агент може набирати очки, наприклад, розміщуючи стрижні з низьким вмістом урану на краях збірки, щоб уповільнити там реакції.
“Після того, як ви запрограмуєте правила, нейронні мережі починають дуже добре діяти, — говорить провідний автор дослідження Маджд Радаідех. — Вони не витрачають час на випадкові процеси. Було весело спостерігати, як вони вчаться грати в ігри подібно людині”.
Завдяки навчанню з підкріпленням ШІ навчився грати у складніші ігри не гірше людей або навіть краще. Але його можливості залишаються марними в реальному світі. Тепер дослідники довели, що у навчання з підкріпленням є потенціал.
“Це дослідження є захоплюючим прикладом використання технології штучного інтелекту для настільних та відео ігор, що допомагає нам розв’язувати практичні проблеми у світі”, — робить висновок співавтор дослідження, науковий співробітник MIT Quest for Intelligence Джошуа Джозеф.
Exelon зараз тестує бета-версію системи штучного інтелекту у віртуальному середовищі. За словами представника компанії, система може бути готова до впровадження через рік або два.
Як писали раніше Investory News, пристрій Halo Band від Amazon працює у парі з оздоровчим додатком на базі штучного інтелекту. Він показує дані про стан здоров’я користувача, такі як процентний вміст жиру в організмі та якість сну, а також відстежує настрій і аналізує тон голосу.
Більше новин та актуальних матеріалів Investory News у нашому каналі в Telegram
Ми у соцмережах