Site icon CYBER STATE новости технологий

Илон Маск утверждает, что ИИ исчерпал реальные данные для обучения

В недавнем интервью на CES Илон Маск предположил, что искусственный интеллект в основном использовал все доступные данные для обучения в первом мире, что показало генерацию синтетических данных в качестве основного пути вперед. Эта идея соответствует теме, которую сказал бывший главный научный сотрудник OpenAI Илья Суцкевер о передаче «пиковых данных» в разработку ИИ.

Маск считает, что в 2024 году у нас закончились данные, созданные людьми. Благодаря генеральному директору Tesla и известному бизнесмену xAI, который может заставить ИИ создавать собственные данные для обучения — это самое практичное решение для продвижения ИИ вперед. Этот метод позволяет системам ИИ проверять себя и изучать ход дел.

Крупнейшие технологические компании уже запрыгнули в поезд синтетических данных. Например, недавно открытая модель Phi-4 от Microsoft основана на синтезе синтетической информации, в то время как Google использует аналогичный эффект для своих моделей Gemma. Сонет Клода 3.5 от Anthropic и последняя серия Llama от Meta также основаны на данных, сгенерированных ИИ.

Между тем аналитики Gartner прогнозируют, что к 2024 году около 60 процентов данных будут влиять на проекты ИИ и аналитики, которые будут синтетическими. Одной из основных причин такого сдвига является стоимость. Стартап ИИ Writer утверждает, что потратил около 700 000 долларов на разработку своей модели Palmyra X 004 — это намного дешевле, чем предполагаемые 4,6 миллиона долларов на создание последовательной модели OpenAI.

Но синтетические данные не являются проблемой. Исследователи предупреждают о риске «коллапса моделей», когда ИИ может стать менее изобретательным и более предвзятым. Данная проблема может возникнуть, если какие-либо предубеждения в исходном наборе данных усилятся, когда ИИ начнет самостоятельно выдавать новые данные.


ЕСЛИ ВЫ ЖЕЛАЕТЕ ЗАКАЗАТЬ РЕКЛАМУ НА САЙТЕ CYBERSTATE.KZ, ПИШИТЕ НАМ НА ПОЧТУ: editor@cyberstate.kz

Exit mobile version