Компаниите за изкуствен интелект, които досега са инвестирали милиарди долари в разработването на големи езикови модели, сега залагат на нова стратегия за увеличаване на приходите чрез по-малки езикови модели. Apple, Microsoft, Meta и Google наскоро представиха нови AI модели с по-малко „параметри“ – броят на променливите, използвани за обучението на системата. Въпреки това, тези модели запазват мощни възможности.
Тези нови стъпки са насочени към предприятията, които се притесняват от високите разходи и необходимата изчислителна мощ за управлението на големи езикови модели, като тези използвани в чатботове като ChatGPT на OpenAI. Обикновено, колкото повече параметри има един модел, толкова по-добре се справя със сложни задачи. Например, новите модели като GPT-4o на OpenAI и Gemini 1.5 Pro на Google имат над 1 трилион параметри, докато Meta разработва версия с 400 милиарда параметри за своя модел Llama с отворен код.
За да преодолеят предизвикателствата, свързани с високите разходи и опасенията относно данните и авторските права, компании като Meta и Google предлагат по-малки модели с няколко милиарда параметри. Тези по-малки модели са по-евтини, енергийно ефективни и могат да бъдат персонализирани, като същевременно защитават чувствителни данни.
Ерик Бойд, корпоративен вицепрезидент на Azure AI Platform в Microsoft, споделя пред Financial Times, че предлагането на високо качество на по-ниска цена позволява на клиентите да използват повече приложения и да реализират проекти, които преди това не са били икономически оправдани.
Google, Meta, Microsoft и френският стартъп Mistral също представиха малки езикови модели, които показват напредък в технологията и могат да бъдат по-фокусирани върху конкретни приложения. Ник Клег, президент по глобалните въпроси на Meta, сподели пред FT, че новият модел Llama 3 с 8 милиарда параметри е сравним или дори по-ефективен от GPT-4. Microsoft заяви, че нейният модел Phi-3-small със 7 милиарда параметри превъзхожда GPT-3.5.
Малките модели могат да обработват задачи локално на устройството, което е привлекателно за клиентите, загрижени за неприкосновеността на личния живот и желаещи да гарантират, че информацията остава във вътрешните мрежи. Шарлот Маршал от адвокатската кантора Addleshaw Goddard коментира, че тези модели дават възможност на предприятията да преодолеят правните и финансовите проблеми.
Малките модели също така позволяват функциите на AI да работят на устройства като мобилни телефони. Google интегрира своя модел „Gemini Nano“ в смартфона Pixel и в Samsung S24. Apple също разработва модели за iPhone и наскоро пусна OpenELM – малък модел за текстови задачи. Главният изпълнителен директор на OpenAI Сам Алтман обяви, че компанията предлага различни по размер модели AI, които служат за отделни цели, но остава фокусирана върху създаването на по-големи модели с разширени възможности, включително способността да разсъждават, планират и изпълняват задачи на човешко ниво.






