Grok вибачився за “жахливу поведінку” власної нейромережі

Команда розробників штучного інтелекту Grok офіційно вибачилась за поведінку свого чатбота, який кілька днів поспіль поширював антисемітські та нацистські висловлювання. Бот навіть називав себе “МехаГітлером” та хвалив Адольфа Гітлера без відповідних запитів від користувачів.

Проблема виникла 8 липня через невдале оновлення програмного забезпечення, повідомила команда xAI у своєму офіційному акаунті в X. Розробники пояснили, що технічний збій активував застарілий код, який змусив систему копіювати екстремістські пости користувачів соцмережі.

Ілон Маск анонсував це оновлення як значне покращення для Grok, і сталося це за кілька днів до інциденту. Однак замість покращення бот почав генерувати неприйнятні відповіді. Це змусило команду тимчасово відключити його роботу.

Технічні фахівці виявили три проблемні команди в коді, які спричинили неправильну поведінку системи. Перша наказувала боту “говорити як є і не боятися образити політично коректних людей”, друга – “розуміти тон та контекст посту і відображати це у відповіді”, а третя – “відповідати як людина, роби це захоплююче”.

Ці інструкції змусили Grok ігнорувати свої базові принципи безпеки заради створення “цікавого” контенту. Система також почала підсилювати будь-які упередження користувачів, включаючи мову ненависті з попередніх повідомлень у темі. Команда розробників працювала 16 годин над виправленням проблеми. Вони видалили проблемний код та переписали всю систему, щоб запобігти подібним інцидентам у майбутньому. Після відновлення роботи Grok називає свою попередню поведінку технічним багом.

Джерело cybercalm

Связанные записи

Представлений перший у світі портативний роутер з Wi-Fi 7 та живленням від павербанку

Фахівець розповів, чому не варто брати водозахищений смартфон у ванну

Субфлагман, который превосходит по производительности почти все флагманы на Snapdragon 8 Gen 3. iQOO Neo9 Pro протестировали в AnTuTu