Naujausi dirbtinio intelekto modeliai bei jų atnaujinimai
Šįkart apžvelgsime visus naujus modelius bei jų atnaujinimus, kurie išėjo dar 2025-aisiais metais. Nuo Chat-GPT 4-o vaizdų kūrimo įrankio iki Google Gemini, Stability.AI ir kt. generatyvinių modelių bei jų atnaujinimų.
Šarūnas Dignaitis - Kerpė
3/31/20253 min read
Naujausi dirbtinio intelekto modeliai bei jų atnaujinimai
Google Gemini 2.5
loginis modelis, anot „Google“, puikiai kuria internetines programėles ir kodavimo agentus. Vis dėlto jis prastesnis viename populiariame kodavimo etalone nei Claude Sonnet 3.7. Šiam modeliui reikia 20 JAV dolerių/mėn. „Gemini Advanced“ prenumeratos.
ChatGPT-4o vaizdų generatorius
„OpenAI“ atnaujino esamą GPT-4o modelį, kad jis generuotų ne tik tekstą, bet ir vaizdus. Pagerintas modelis greitai išpopuliarėjo dėl gebėjimo transformuoti paveikslėlius į Studio Ghibli stiliaus anime, nepaisant akivaizdžių autorinių teisių problemų. Norint naudotis GPT-4o, reikia bent 20 JAV dolerių/mėn. Ir, aišku, „ChatGPT Plus“ prenumeratos.
Stability AI „Stable Virtual Camera“
Vaizdų generavimo startuolis „Stability AI“ pristatė modelį, kuris, kaip teigiama, gali generuoti 3D scenas ir kameros kampus iš vieno 2D paveikslėlio. Vis dėlto modelis vis dar sunkiai susidoroja su sudėtingesniais vaizdais, pavyzdžiui, žmonėmis ar judančiu vandeniu. Modelis prieinamas nemokamam moksliniam naudojimui per „HuggingFace“.
Cohere „Aya Vision“„Cohere“ išleido multimodalinį modelį pavadinimu „Aya Vision“, kuris, anot jų, pirmauja tokiose užduotyse kaip vaizdų aprašymas ir atsakymai į klausimus apie nuotraukas. Jis taip pat gerai veikia kitomis kalbomis, ne tik anglų, ko trūksta daugeliui kitų modelių. Prieinamas nemokamai per „WhatsApp“.
OpenAI „GPT-4.5 Orion“
„OpenAI“ vadina Orion iki šiol didžiausiu savo modeliu, akcentuodama jo stiprias „pasaulio žinias“ ir „emocinį intelektą“. Visgi kai kuriais loginiais testais jis nusileidžia naujesniems modeliams. Prieinamas su 200 JAV dolerių/mėn. „ChatGPT Pro“ prenumerata.
Claude Sonnet 3.7
„Anthropic“ teigia, kad tai pirmasis pramonėje „hibridinis“ loginis modelis - jis gali tiek greitai pateikti atsakymus, tiek ilgiau „pamąstyti“, kai reikia. Vartotojai taip pat gali kontroliuoti, kiek laiko modelis gali „galvoti“. Prieinamas visiems „Claude“ vartotojams, tačiau pastoviems vartotojams reikia 20 JAV dolerių/mėn. „Pro“ plano.
xAI „Grok 3“
Grok 3 - naujausias pagrindinis modelis iš Elono Musko įkurtos „xAI“. Teigiama, kad jis lenkia kitus modelius matematikos, mokslo ir programavimo srityse. Reikalauja „X Premium“ prenumeratos, kuri kainuoja 50 JAV dolerių/mėn. Po tyrimo, parodžiusio, kad „Grok 2“ turėjo kairiųjų pažiūrų šališkumą, Muskas pažadėjo modelį padaryti „politiškai neutralesnį“, tačiau dar neaišku, ar tai pavyko.
OpenAI „o3-mini“
Naujausias „OpenAI“ loginis modelis, optimizuotas STEM (mokslas, technologijos, inžinerija, matematika) užduotims - programavimui, matematikai, mokslui. Nors tai ne pats galingiausias modelis, dėl mažesnio dydžio jis yra gerokai pigesnis. Prieinamas nemokamai, bet intensyviam naudojimui reikalinga prenumerata.
OpenAI „Deep Research“
„OpenAI Deep Research“ skirtas išsamiems tyrimams su aiškiomis nuorodomis. Paslauga prieinama tik su 200 USD/mėn. „ChatGPT Pro“ planu. Rekomenduojama naudoti tiek moksliniams tyrimams, tiek, pavyzdžiui, apsipirkimui. Visgi reikėtų žinoti, kad dirbtinio intelekto „halucinacijos“ vis dar kelia problemų.
Mistral „Le Chat“
„Mistral“ pristatė programėlės versiją „Le Chat“ - multimodalinį asmeninį dirbtinio intelekto asistentą. „Mistral“ teigia, kad „Le Chat“ reaguoja greičiau nei bet kuris kitas pokalbių robotas. Mokama versija taip pat siūlo naujausias žinias iš AFP agentūros. „Le Monde“ testai parodė įspūdingą našumą, tačiau pastebėta daugiau klaidų nei naudojantis „ChatGPT“.
OpenAI „Operator“
„Operator“ skirtas būti asmeniniu virtualiu praktikantu, galinčiu savarankiškai vykdyti užduotis - pvz., padėti apsipirkti. Reikalinga 200 JAV dolerių/mėn. „ChatGPT Pro“ prenumerata. Nors dirbtinio intelekto agentai žada daug, jie vis dar eksperimentiniai: vienas „Washington Post“ apžvalgininkas teigė, kad „Operator“ savarankiškai užsakė 12 kiaušinių už 31 dolerį, panaudodamas jo kreditinę kortelę.
Google Gemini 2.0 Pro Experimental
Ilgai lauktas „Google Gemini“ flagmanas, kuris, kaip teigiama, puikiai tvarkosi su programavimu ir bendrų žinių supratimu. Jis taip pat turi itin ilgą konteksto langą - 2 milijonus žodžių, kas naudinga apdorojant didelius teksto kiekius. Reikalauja bent „Google One AI Premium“ prenumeratos už 20 JAV dolerių/mėn.
„Apple“ „Health“ programėlė turės dirbtinio intelekto trenerį
Pasak „Bloomberg“ žurnalisto Marko Gurmano, „Apple“ kuria naują savo „Health“ programėlės versiją, kurioje bus dirbtinio intelekto treneris, galintis patarti vartotojams, kaip pagerinti savo sveikatą.
Gurmanas pirmą kartą apie tokį projektą pranešė dar 2023-iais m., tačiau dabar teigia, kad kūrimo darbai juda į priekį, o naujos funkcijos gali pasirodyti jau 2026-ųjų m. pavasarį arba vasarą kartu su „iOS 19.4“ versijos išleidimu.
Dirbtinio intelekto trenerio patarimai būtų pagrįsti duomenimis iš vartotojų prietaisų, taip pat, kaip teigiama, apimtų ir maisto sekimą. Šiuo metu treneris mokomas naudojant „Apple“ gydytojų personalo duomenis, o bendrovė ketina įtraukti ir daugiau gydytojų, kad šie įrašytų su sveikata susijusius vaizdo įrašus.
Pasak Gurmano, ši nauja paslauga šiuo metu laikinai vadinama „Health+“.