Головна
Новини
Виявлено проблеми у штучного інтелекту від Meta, Anthropic і Cohere

Новини

21 Серпня 2023

321

Виявлено проблеми у штучного інтелекту від Meta, Anthropic і Cohere

Він вигадує факти більше за OpenAI з GPT-4

Дослідники з Arthur AI протестували найкращі моделі штучного інтелекту від Meta, OpenAI, Cohere та Anthropic і виявили, що деякі моделі вигадують факти значно частіше, ніж інші, повідомляє CNBC.

“Галюцинації” штучного інтелекту виникають, коли великі мовні моделі, або LLM, повністю фабрикують інформацію, поводячись так, ніби вони висловлюють факти. Чудовим прикладом є скандал, коли адвокат через “галюцинації” ChatGPT посилався на фальшиві справи у федеральному суді Нью-Йорка (і врешті решт отримав за це покарання).

В експерименті дослідники Arthur AI протестували моделі штучного інтелекту в таких категоріях, як комбінаторна математика, президенти США та марокканські політичні лідери, ставлячи запитання, розроблені таким чином, щоб вимагати від нейромереж кількох кроків розміркування щодо інформації.

Загалом GPT-4 від OpenAI показав найкращі результати з усіх протестованих моделей, і дослідники виявили, що він має “галюцинацій” менше, ніж його попередня версія, GPT-3.5. Наприклад, на математичні запитання він галюцинує від 33% до 50% менше, в залежності від категорії.

У математичній категорії GPT-4 посів перше місце, за ним з невеликим відривом слідував Claude 2.

Але в президентах США Claude 2 посів перше місце за точністю, потіснивши GPT-4 на друге. Коли його запитали про марокканську політику, GPT-4 знову став першим, а Claude 2 від Anthropic та Llama 2 майже повністю провалили завдання.

У другому експерименті дослідники перевірили, наскільки моделі штучного інтелекту захищатимуть свої відповіді застережливими фразами типу “Як модель штучного інтелекту я не можу висловлювати думку…”.

Що стосується хеджування, GPT-4 мав зростання на 50% порівняно з GPT-3.5, що “кількісно підтверджує неофіційні дані користувачів про те, що використання GPT-4 викликає більше розчарувань”.

З іншого боку, згідно зі звітом, модель штучного інтелекту Cohere взагалі не хеджувала в жодній зі своїх відповідей. Дослідження показало, що Claude 2 був найнадійнішим з точки зору “самосвідомості”, тобто точно оцінював, що він робить, а чого не знає, і відповідав лише на запитання, щодо яких мав навчальні дані.

Нагадаємо, Xiaomi представила нову робособаку.

Більше новин та актуальних матеріалів Investory News у нашому каналі в Telegram

Катерина Тоцька

21 Серпня 2023

до новин

Виявлено проблеми у штучного інтелекту від Meta, Anthropic і Cohere

Контекст

Французькій DVL Telecom отримав дозвіл придбати український lifecell

Де у світі найшвидший інтернет

У Китаї розробили генератор електрики від крапель дощу

У світ вперше зʼявиться корм для тварин з культивованого мʼяса

Microsoft випустила застосунок Designer

Huawei закінчує будівництво масштабного центру розробки чипів

Jaguar скорочує модельний ряд у шість разів

OpenAI звинуватили у порушенні федеральних законів

“Dyson” скоротить понад чверть свого персоналу

Відтепер бізнес може підписувати документи з ЄС онлайн

Samsung презентувала розумну каблучку

Tesla Cybertruck отримає намет з ліжком

Перша “розумна” дорога з’явиться в США

США посилили тиск на китайську Huawei

Lego створила детальки з космічного пилу

Новини

В Британії продадуть ядерний бункер

Мультфільм “Думками навиворіт 2” став найкасовішим в історії

Hyundai звітувала, що її прибуток виріс на 25%

Французькій DVL Telecom отримав дозвіл придбати український lifecell

НБУ покращив прогнози зростання економіки України

Єкспорт українського продовольства збільшився до $12 мільярдів

Тепер Ferrari можна придбати за крипту в Європі

Кава здорожчає ще більше

З початку року за програмою “Доступні кредити 5-7-9%”видано кредитів на понад 50 мільярдів

Виробник Mattel випустили першу незрячу ляльку Barbie

IN BEST: Найдорожчі автомобілі у світі 2023 року

Найкоштовніші рідкісні камені світу

Унікальна Україна: Озера, що вражають своєю красою

IN BEST: Найкоштовніші рубіни світу

Ми у соцмережах

Дякуємо! Надалі ви будете отримувати найцікавіші новини від InveStory news!

Дякуємо! Ваш голос вже враховано. Згідно з нашими правилами проголосувати можна лише одного разу і ви це вже зробили.

ДЯКУЄМО ЗА ВАШ ГОЛОС! ЗАЛИШАЙТЕСЬ З INVESTORY NEWS!