Водещи модели за изкуствен интелект, разработени от компании като Google, OpenAI и Anthropic, не успяха да реализират печалба при залози в симулация на сезон 2023–24 във Висшата лига, показва ново публикувано проучване. Изследването, проведено от лондонския стартъп General Reasoning под името „KellyBench“, и съобщава town.bg, поставя акцент върху ограниченията на тези системи при прогнозиране и дългосрочно поведение в реалистични, динамични среди.
Експериментът е включвал осем от най-напредналите AI модели, които са получили подробни исторически данни и статистика за всеки от отборите в английската Висша лига, както и информация за предишните мачове. Задачата на всяка система е била да изгради предсказателни модели с цел максимизиране на възвръщаемостта при залагане, при едновременно управление на рисковете. След обучение „агентите“ правели залози за крайния изход на срещите и за броя на головете, като целта е била да се провери колко добре могат да се адаптират към нови събития и към обновявани данни за играчи и форма.
Правилата на симулацията са били стриктни: моделите нямали достъп до интернет, за да извличат вече налични резултати или външни анализи. Всеки модел е получил точно по три опита да приключи сезона на печалба, което е трябвало да тества и устойчивостта при различни начални условия и стратегии за залагане. Според описанието в доклада, въпреки че някои системи показвали обещаващи резултати в отделни рундове, в общия баланс всички осем модела затворили експеримента с нетни загуби.
Авторите на „KellyBench“ използват резултатите, за да подчертаят разликата между бързо напредващите умения на AI в специализирани задачи — например генериране на код или обработка на език — и по-сложните предизвикателства при вземане на решения в непълна, променлива и шумна среда като спортните събития. Според екипа на General Reasoning, моделите срещат трудности да интегрират редки, непредвидими събития и да балансират експлоатация на очевидни тенденции спрямо адаптация към внезапни промени в информацията.
Ограниченията на експеримента са ключови за интерпретацията на резултатите: симулацията е изолирана от реални пазари и психологически фактори, а забраната за онлайн достъп е преднамерено въведена, за да се оцени способността на моделите да учат и да се адаптират само от предоставените данни. Въпреки това изходът от теста показва, че дори когато AI разполага с богата историческа информация, това не гарантира успешни решения в дългосрочен план, когато целта е максимизиране на парични възнаграждения при риск.
Резултатите имат последствия за области извън спортните залози. Изследователите предупреждават, че системи, които работят добре при контролирани задачи, могат да демонстрират значителни слабости при прилагане в реалния свят, където непълната информация, рядките събития и нуждата от динамично управление на риска са съществени. Тези наблюдения са от значение за фирми и организации, които обмислят внедряване на AI решения за финансови прогнози, логистика или управление на критични операции.
В анализа се посочва също, че трите опита за печалба на модел са имали за цел да имитират условия, при които разработчиците биха могли да пренастроят системите между различни кампании, но въпреки това моделите не успели да систематично подобрят резултатите си. Това поражда въпроси за настойническите механизми за контрол, за методите за оценка на риска и за начина, по който се тренират подобни системи при ограничен достъп до външни източници.
Новината е важна за технологичната общност и за широката публика, тъй като поставя под въпрос очакванията за универсалност на напредналите AI инструменти и подчертава нуждата от по-задълбочени изследвания в реалистични сценарии. Това са важни новини за всички, които следят развитието на изкуствения интелект и неговото влияние върху икономиката и обществото, отбелязват авторите в заключение.
Статията е част от репортажи и анализи на таун.бг, които проследяват технологичните тенденции и техните последици.
Абонирайте се за нас в Google News.







