Джинан Варрайят (Jinan Warrayat)
Модели, основанные на новой гибридной архитектуре, обеспечивают более высокую точность при работе с меньшим количеством параметров
Запуск этого проекта подчеркивает стремление ОАЭ конкурировать с мировыми лидерами в области ИИ в сфере высокопроизводительных языковых моделей
Институт технологических инноваций (TII), подразделение прикладных исследований Совета по исследованиям в области передовых технологий Абу-Даби (ATRC), объявил о выпуске Falcon-H1 Arabic, новой большой языковой модели, построенной на гибридной архитектуре Mamba-Transformer. Эта новая модель, полностью отличающаяся от предыдущих версий на основе трансформеров, зарекомендовала себя как самая производительная система в рейтинге Open Arabic LLM Leaderboard (OALL).
Это достижение делает Falcon-H1 Arabic ведущей моделью ИИ для арабского языка, доступной в настоящее время. Она превосходит по производительности модели, которые больше ее в несколько раз, и при этом обеспечивает высочайшую точность, обработку контекста и лингвистическое представление.
Его Превосходительство Фейсал аль Баннаи, советник президента ОАЭ и генеральный секретарь Совета по исследованиям в области передовых технологий, заявил: «Falcon-H1 Arabic отражает наше неизменное стремление к укреплению позиций ОАЭ как глобального центра передовых технологий и ответственного использования ИИ. Разрабатывая модели, учитывающие языковые и культурные потребности региона, мы способствуем внедрению инноваций, которые являются доступными, актуальными и оказывают значительное влияние на все общество. Это достижение свидетельствует о высоком уровне таланта и исследовательского опыта, которыми обладает TII».
Опираясь на успех моделей Falcon-Arabic, выпущенных ранее в этом году, которые продемонстрировали явную потребность сообщества в высококачественных арабских LLM, исследовательский центр TII продолжил свою работу над новой семейством Falcon-H1 Arabic. Доступны модели с 3 млрд, 7 млрд и 34 млрд параметров, которые предназначены для удовлетворения различных потребностей инфраструктуры и сценариев использования. Falcon-H1 Arabic обеспечивает повышение качества данных, охвата диалектов, стабильности длинного контекста и математических рассуждений, что позволяет более точно, надежно и с учетом контекста понимать арабский язык в реальных условиях.
Д-р Наджва Аарадж, генеральный директор TII, заявила: «Разработка Falcon-H1 Arabic основана на многолетней фундаментальной работе в области арабскоязычного ИИ и напрямую отвечает потребностям наших сообществ, включая разработчиков и предприятия. Совершенствуя архитектуру, качество данных и способность к рассуждениям в рамках длинного контекста, мы создаем инструменты, которые открывают новые возможности в области образования, здравоохранения, управления, предпринимательства и других сферах, и все это на арабском языке. Эта модель представляет собой важный шаг в нашей миссии по созданию ИИ мирового класса, который будет служить интересам региона и способствовать глобальному прогрессу».
Результаты тестирования
В рейтинге OALL, который оценивает модели по широкому спектру задач на понимание и рассуждение на арабском языке, Falcon-H1 Arabic демонстрирует явное лидерство по производительности:
Модель 3B набирает в среднем 61,87%, опережая на 10 пунктов ведущих конкурентов 4B, таких как Microsoft Phi-4 Mini.
Модель 7B набрала в среднем 71,47%, превзойдя все модели с объемом данных около 10 млрд, включая катарскую Fanar-1-9B и саудовскую HUMAIN ALLaM 7B.
Модель 34B набирает 75,36%, превосходя даже системы 70B+, включая китайскую Qwen2.5 72B и Llama-3.3 70B от META.
Помимо OALL, модели Falcon-H1 Arabic также демонстрируют выдающиеся результаты в более узкоспециализированных тестах, включая (i) 3LM для рассуждений в области STEM, (ii) ArabCulture для понимания культурных и контекстуальных особенностей и (iii) AraDice (понимание диалектов).
В совокупности эти результаты представляют собой прорыв в области арабоязычного ИИ. Falcon-H1 Arabic не только превосходит по производительности модели, которые в несколько раз больше ее, как по общим, так и по специализированным показателям, но и демонстрирует уровень лингвистической глубины, способности к рассуждениям и эффективности, который устанавливает новый стандарт в этой области. Это делает Falcon-H1 Arabic самой мощной и универсальной моделью для арабского языка, разработанной на сегодняшний день.
Д-р Хаким Хасид, главный научный сотрудник Центра искусственного интеллекта и цифровых исследований (AIDRC) при TII, сказал: «Эта модель отражает нашу ориентированность на создание арабского ИИ, который будет не только более совершенным, но и действительно полезным в реальных условиях. Повышая эффективность, глубину понимания и языковой охват, мы создаем системы ИИ, которые могут лучше поддерживать учреждения, разработчиков и сообщества по всему региону».
Модель также значительно увеличивает длину контекста, поддерживая окна до 256 тыс. токенов, что позволяет ей обрабатывать большие объемы информации за одно взаимодействие. На практике это означает, что пользователи могут, например, анализировать объемные юридические документы, медицинские записи, научные работы или базы знаний предприятия без потери контекста или непрерывности. Ранее это было невозможно в таких масштабах.
С 2023 года модели Falcon AI от TII занимают первое место в региональных и мировых рейтингах, а Falcon-H1 Arabic теперь лидирует в рейтинге Open Arabic LLM Leaderboard среди моделей всех размеров. Эти результаты демонстрируют способность TII создавать собственные системы ИИ, которые могут конкурировать на самом высоком мировом уровне и укрепляют лидерство Абу-Даби и ОАЭ в целом в исследованиях и инновациях в области искусственного интеллекта на арабском языке.
Новые модели теперь доступны на игровой площадке через общедоступный интерфейс TII по адресу: https://chat.falconllm.tii.ae.
Джинан Варрайят (Jinan Warrayat)