Метод DeepSeek для обучения нейросетей может открыть новые возможности ИИ

Новый метод обучения нейросетей «гиперсвязи с ограничением на многообразие», разработанный китайской компанией DeepSeek, может привести к новому уровню развития технологии искусственного интеллекта (ИИ), считает IT-редакция ИА Красная Весна.
Существующие методы обучения нейросетей уперлись в «потолок»: каждый следующий процент качества требует непропорционально больших затрат. Новый метод накладывает математические ограничения при обучении, предотвращая сбои из-за исчезающих или чрезмерно усиливающихся сигналов. Тестирование показало, что метод повышает стабильность и качество обучения, увеличивая время обучения лишь на 6,7%.
Читайте также: В DeepSeek придумали более стабильный и эффективный способ обучения ИИ
Если новый метод будет работать, то это может привести к решению проблемы нестабильности в обучении, которая возникает при использовании более сложных архитектур. Если западные компании стремятся достичь лидерства в технологии ИИ, опираясь на развитие инфраструктуры и препятствуя продажам оборудования в другие страны, то в Китае сделали ставку на развитие архитектуры моделей.
DeepSeek в январе прошлого года уже удивила тем, что выпустила чат-бот R1, который по ряду показателей превзошел ChatGPT, считавшийся на тот момент наиболее эффективным. При этом китайская модель потребляет гораздо меньше ресурсов. Тогда это привело к падению курса акций американских IT-гигантов. История может повториться в феврале 2026 года, когда ожидается выход модели V4.
В целом история успеха DeepSeek показывает, что в развитии передовой технологии важна команда людей, способная находить нестандартные решения. Именно это позволяет конкурировать с, казалось бы, недосягаемыми американскими корпорациями.