Jennifer Dewan, kommunikációs főigazgató
Jennifer.dewan@tii.ae
A Technológai Innovációs Intézet (TII), amely a világ egyik vezető kutatóközpontja, valamint Abu Dhabi Fejlett Technológiai Kutatótanácsának (Advanced Technology Research Council) alkalmazott kutatási pillére, kiadta a Falcon sorozat új nagy nyelvi modelljét, a Mamba 7B-t. Az új modell a világ elsőszámú, világszinten elérhető, nyílt forráskódú állapottér nyelvi modellje (SSLM), amely független ellenőrzését a Hugging Face végzi.
A Falcon első állapottér nyelvi modelljeként eltér a korábbi Falcon modellektől, amelyek mind transzformátor architektúrát használnak. Az új Falcon Mamba 7B modell újabb példája az intézetben folyó úttörő kutatásoknak, illetve az áttörést jelentő eszközöknek és termékeknek, amelyeket nyílt forráskóddal tesz elérhetővé mindenki számára.
Faisal Al Bannai, a Fejlett Technológiai Kutatótanács főtitkára és az Egyesült Arab Emírségek elnökének stratégiai kutatási és fejlett technológiai ügyekért felelős tanácsadója elmondta: „A Falcon Mamba 7B a Technológiai Innovációs Intézet egymást követő negyedik első rangú mesterséges intelligencia modellje, ami megerősíti Abu Dhabit, mint a mesterséges intelligencia kutatásának és fejlesztésének globális központját. Ez az eredmény rávilágít az Egyesült Arab Emírségek rendíthetetlen elkötelezettségére az innováció iránt.”
A transzformátor architektúrájú modelleket tekintve a Falcon Mamba 7B felülmúlja a Meta Llama 3.1 8B, a Llama 3 8B és a Mistral 7B teljesítményét a Hugging Face legújabb értékelése szerint. Ezenkívül a Falcon Mamba 7B a többi SSLM esetében is legyőzi az összes többi nyílt forráskódú modellt a régi teljesítményértékelésekben, és ez lesz az első modell a Hugging Face új, szigorúbb értékelésen alapuló ranglistáján.
Dr. Najwa Aaraj, a Technológiai Innovációs Intézet vezérigazgatója elmondta: „A Technológiai Innovációs Intézet az AI-modellek Falcon sorozatával továbbra is a technológia határait feszegeti. A Falcon Mamba 7B igazi úttörő munkát végez, és megnyitja az utat a jövőbeli AI-innovációk előtt, amelyek bővítik az emberi képességeket és javítják az életünket.”
Az állapottér modellek rendkívül hatékonyak abban, hogy olyan összetett helyzeteket értsünk meg, amelyek idővel változnak, akár egy egész könyvet. Ez azért van így, mert az SSLM-ek nem igényelnek további memóriát ilyen nagy mennyiségű információ feldolgozásához.
A transzformátor alapú modellek viszont nagyon hatékonyan emlékeznek a korábban már egymás után feldolgozott információkra. Ettől annyira jók olyan feladatokban, mint a tartalomgenerálás, azonban mivel minden szót összehasonlítanak minden más szóval, jelentős számítási teljesítményt igényelnek.
Az SSLM-ek számos területen alkalmazhatók, például becslési, előrejelzési és ellenőrzési feladatokban. A transzformátor architektúrájú modellekhez hasonlóan kiemelkednek a természetes nyelvfeldolgozási feladatokban is, és alkalmazhatók gépi fordítás, szövegösszegzés, számítógépes látás és hangfeldolgozás területén is.
Dr. Hakim Hacid, a Technológai Innovációs Intézet mesterséges intelligencia cross-center egységének megbízott vezető kutatója elmondta: „A Falcon Mamba 7B bemutatásával büszkeséggel tölt el a Technológiai Innovációs Intézet együttműködő rendszere, amely elősegítette a fejlesztést. Ez a verzió jelentős előrelépést jelent, új perspektívákat nyit meg, és tovább ösztönzi az intelligens rendszerek kutatását. A Technológiai Innovációs Intézetnél mind az SSLM, mind a transzformátor modellek határait feszegetjük, hogy további innovációt érjünk el a generatív mesterséges intelligencia területén.”
A Falcon LLM-eket több mint 45 milliószor töltötték le, ami a modellek kiemelkedő sikerét bizonyítja. A Falcon Mamba 7B-t a TII Falcon License 2.0, a „permissive Apache 2.0” alapú szoftverlicenc alatt adják ki, amely a mesterséges intelligencia felelős használatát elősegítő felhasználási szabályzatot tartalmaz. Az új modellről további információk a FalconLLM.TII.ae oldalon találhatók.
E közlemény hivatalos, mérvadó változata az eredeti forrásnyelven közzétett szöveg. A fordítás csak az olvasó kényelmét szolgálja, és összevetendo a forrásnyelven írt szöveggel, amely az egyetlen jogi érvénnyel bíró változat.
Jennifer Dewan, kommunikációs főigazgató
Jennifer.dewan@tii.ae