Jinan Warrayat
jinan.warrayat@tii.ae
Modely založené na nové hybridní architektuře poskytují vyšší přesnost při běhu na menších parametrech
Uvedení na trh podtrhuje snahu Spojených arabských emirátů konkurovat světovým lídrům v oblasti umělé inteligence v oblasti vysoce výkonných jazykových modelů
Technologický inovační institut (TII), aplikovaná výzkumná pobočka Rady pro pokročilý technologický výzkum (ATRC) v Abú Zabí, oznámil Falcon-H1 Arabic, nově vyvinutý velký jazykový model postavený na hybridní architektuře Mamba–Transformer. Tento nový model, který se zcela odlišuje od předchozích verzí založených na transformerové architektuře, se etabloval jako nejvýkonnější systém v žebříčku Open Arabic LLM Leaderboard (OALL).
Tento milník činí z modelu Falcon-H1 Arabic přední arabský model umělé inteligence, který je v současné době k dispozici, a který překonává modely několikrát větší a zároveň poskytuje špičkovou přesnost, zpracování kontextu a jazykovou reprezentaci.
Jeho Excelence Faisal al Bannai, poradce prezidenta Spojených arabských emirátů a generální tajemník Rady pro výzkum pokročilých technologií, řekl: „Falcon-H1 Arabic odráží náš trvalý závazek posilovat pozici Spojených arabských emirátů jako globálního centra pokročilých technologií a odpovědné umělé inteligence. Poskytováním modelů, které podporují jazykové a kulturní potřeby regionu, umožňujeme inovace, které jsou přístupné, relevantní a mají dopad na naše společnosti. Tento úspěch je důkazem hloubky talentu a odborných znalostí v oblasti výzkumu v rámci TII.“
Na základě silného přijetí modelů Falcon-Arabic vydaných na začátku tohoto roku, které zdůraznily jasnou potřebu komunity po vysoce kvalitních arabských velkých jazykových modelů (LLM), TII pokročilo ve své práci s novou rodinou modelů Falcon-H1 Arabic. Modely jsou k dispozici ve velikostech parametrů 3B, 7B a 34B a jsou navrženy tak, aby vyhovovaly různým potřebám infrastruktury a použití. Model Falcon-H1 Arabic přináší vylepšení v oblasti kvality dat, pokrytí dialektů, stability dlouhého kontextu a matematického uvažování, což umožňuje přesnější, spolehlivější a kontextově uvědomělé porozumění arabštině v reálných aplikacích.
Dr. Najwa Aaraj, generální ředitelka TII, řekla: „Vývoj modelu Falcon-H1 Arabic vychází z let základního výzkumu v oblasti arabské umělé inteligence a přímo reaguje na potřeby našich komunit, včetně vývojářů a podniků. Díky pokročilé architektuře, kvalitě dat a uvažování v dlouhodobém kontextu vytváříme nástroje, které otevírají nové možnosti ve vzdělávání, zdravotnictví, správě věcí veřejných, podnikání a dalších oblastech, a to vše v arabštině. Tento model představuje důležitý krok v naší misi poskytovat špičkovou umělou inteligenci, která slouží regionu a přispívá ke globálnímu pokroku.“
Referenční výsledky
V žebříčku OALL, který hodnotí modely v široké škále úkolů týkajících se porozumění a uvažování v arabštině, vykazuje model Falcon-H1 Arabic jasné vedoucí postavení z hlediska výkonu:
Model 3B dosahuje průměrného skóre 61,87 %, což je o 10 bodů více než u předních konkurentů 4B, jako je Phi-4 Mini od společnosti Microsoft.
Model 7B dosahuje průměrného skóre 71,47 %, čímž překonává všechny modely ~10B, včetně modelů Fanar-1-9B z Kataru a HUMAIN ALLaM 7B ze Saúdské Arábie.
Model 34B dosahuje skóre 75,36 %, čímž překonává i systémy s více než 70 miliardami parametrů, včetně čínských modelů Qwen2.5 72B a META Llama-3.3 70B.
Kromě OALL dosahují modely Falcon-H1 Arabic vynikajících výsledků rovněž v cílenějších referenčních testech, včetně (i) 3LM pro uvažování STEM, (ii) ArabCulture pro kulturní a kontextové porozumění a (iii) AraDice (porozumění dialektům).
Tyto výsledky společně představují průlomový moment pro arabskou umělou inteligenci. Model Falcon-H1 Arabic nejenže překonává modely, které jsou několikrát větší, a to jak v obecných, tak ve specializovaných referenčních testech, ale rovněž prokazuje úroveň jazykové hloubky, schopnosti uvažování a efektivity, která stanovuje nový standard v této oblasti. Díky tomu se model Falcon-H1 Arabic stává nejschopnějším a nejuniverzálnějším arabským jazykovým modelem, jaký byl dosud vyvinut.
Dr. Hakim Hacid, hlavní výzkumný pracovník Centra pro umělou inteligenci a digitální výzkum („Artificial Intelligence and Digital Research Centre“, AIDRC) TII řekl: „Tento model odráží náš zaměření na budování arabské AI, která je nejen pokročilejší, ale také skutečně užitečná v reálných situacích. Zlepšením efektivity, hloubky porozumění a jazykového pokrytí umožňujeme systémům umělé inteligence lépe podporovat instituce, vývojáře a komunity v celém regionu.“
Model také výrazně rozšiřuje délku kontextu s okny až 256 000 tokenů, což umožňuje modelům pracovat s velkým objemem informací v rámci jedné interakce. V praxi to znamená, že uživatelé mohou například analyzovat dlouhé právní dokumenty, lékařské záznamy, akademické práce nebo znalostní báze podniků bez ztráty kontextu nebo kontinuity – což je schopnost, která dosud nebyla v tomto měřítku možná.
Modely Falcon AI institutu TII se od roku 2023 umisťují na prvním místě v regionálních a globálních žebříčcích, přičemž model Falcon-H1 Arabic nyní vede žebříček Open Arabic LLM Leaderboard napříč všemi velikostmi modelů. Tyto výsledky demonstrují schopnost TII budovat suverénní schopnosti umělé inteligence, které konkurují na nejvyšší globální úrovni, a zároveň posilují vedoucí postavení Abú Zabí a širších Spojených arabských emirátů v oblasti výzkumu a inovací umělé inteligence pro arabštinu.
Nové modely jsou nyní dostupné v rámci hřiště prostřednictvím veřejného rozhraní TII na adrese: https://chat.falconllm.tii.ae.
Text této zprávy v původním, zdrojovém jazyce je oficiální verzí. Překlad této zprávy do jiných jazyků poskytujeme pouze jako doplňkovou službu. Text zprávy v původním, zdrojovém jazyce je jedinou právně závaznou verzí této tiskové zprávy.
Jinan Warrayat
jinan.warrayat@tii.ae