Jinan Warrayat
jinan.warrayat@tii.ae
Dựa trên kiến trúc lai mới, các mô hình mang lại độ chính xác cao hơn trong khi vận hành với kích thước tham số nhỏ hơn
Lần ra mắt này nhấn mạnh nỗ lực của UAE nhằm cạnh tranh với các quốc gia dẫn đầu toàn cầu về mô hình ngôn ngữ AI hiệu năng cao
Viện Đổi mới Công nghệ (TII), đơn vị nghiên cứu ứng dụng trực thuộc Hội đồng Nghiên cứu Công nghệ Tiên tiến Abu Dhabi (ATRC), đã công bố Falcon-H1 Arabic, một mô hình ngôn ngữ lớn mới được phát triển dựa trên kiến trúc lai Mamba-Transformer. Khác biệt hoàn toàn so với các phiên bản dựa trên transformer trước đây, mô hình mới này đã vươn lên trở thành hệ thống có hiệu suất cao nhất trên Bảng xếp hạng Open Arabic LLM Leaderboard (OALL).
Cột mốc này đưa Falcon-H1 Arabic trở thành mô hình AI tiếng Ả Rập dẫn đầu hiện nay, vượt trội so với các mô hình lớn hơn nhiều lần trong khi vẫn cung cấp độ chính xác, khả năng xử lý ngữ cảnh và biểu đạt ngôn ngữ đẳng cấp.
Ngài Faisal al Bannai, Cố vấn của Tổng thống UAE kiêm Tổng Thư ký Hội đồng Nghiên cứu Công nghệ Tiên tiến cho biết: “Falcon-H1 Arabic phản ánh cam kết liên tục của chúng tôi trong việc củng cố vị thế của UAE như một trung tâm toàn cầu về công nghệ tiên tiến và AI có trách nhiệm. Bằng cách cung cấp các mô hình hỗ trợ nhu cầu ngôn ngữ và văn hóa của khu vực, chúng tôi thúc đẩy đổi mới sáng tạo dễ tiếp cận, phù hợp và tạo tác động sâu rộng trong toàn xã hội. Thành tựu này là minh chứng cho chiều sâu về nhân lực tài năng và chuyên môn nghiên cứu tại TII.”
Tiếp nối sự đón nhận mạnh mẽ dành cho các mô hình Falcon-Arabic ra mắt đầu năm nay, vốn đã làm nổi bật nhu cầu rõ rệt của cộng đồng đối với các mô hình ngôn ngữ lớn tiếng Ả Rập chất lượng cao, TII đã tiếp tục phát triển với dòng sản phẩm Falcon-H1 Arabic mới. Các mô hình này có sẵn với kích thước tham số 3B, 7B và 34B, được thiết kế để đáp ứng nhu cầu đa dạng về hạ tầng và các kịch bản sử dụng khác nhau. Falcon-H1 Arabic mang đến những cải tiến về chất lượng dữ liệu, độ bao phủ phương ngữ, độ ổn định trong ngữ cảnh dài và khả năng suy luận toán học, cho phép hiểu tiếng Ả Rập chính xác, đáng tin cậy và phù hợp với ngữ cảnh hơn trong các ứng dụng thực tiễn.
Tiến sĩ Najwa Aaraj, Giám đốc điều hành TII, cho biết: “Việc phát triển Falcon-H1 Arabic dựa trên nhiều năm nghiên cứu cốt lõi về AI tiếng Ả Rập và đáp ứng trực tiếp nhu cầu của cộng đồng chúng tôi, bao gồm cả các nhà phát triển và doanh nghiệp. Thông qua việc nâng cao kiến trúc, chất lượng dữ liệu và khả năng suy luận trong ngữ cảnh dài, chúng tôi đang tạo ra các yếu tố thúc đẩy mở ra những khả năng mới trong giáo dục, y tế, quản trị và doanh nghiệp, cùng nhiều lĩnh vực khác, tất cả đều bằng tiếng Ả Rập. Mô hình này đại diện cho một bước tiến quan trọng trong sứ mệnh của chúng tôi nhằm cung cấp AI đẳng cấp thế giới phục vụ khu vực và đóng góp vào sự tiến bộ toàn cầu.”
Kết quả Đánh giá Hiệu năng
Trên bảng xếp hạng OALL – nơi đánh giá các mô hình qua nhiều tác vụ đa dạng về khả năng hiểu và suy luận tiếng Ả Rập – Falcon-H1 Arabic thể hiện rõ vị thế dẫn đầu về hiệu suất:
Mô hình 3B đạt điểm trung bình 61,87%, vượt 10 điểm so với các đối thủ 4B hàng đầu như Phi-4 Mini của Microsoft.
Mô hình 7B đạt điểm trung bình 71,47%, vượt qua tất cả các mô hình ~10B, bao gồm Fanar-1-9B của Qatar và HUMAIN ALLaM 7B của Ả Rập Xê Út.
Mô hình 34B đạt 75,36%, vượt trội hơn cả các hệ thống có trên 70B tham số, bao gồm Qwen2.5 72B của Trung Quốc và Llama-3.3 70B của META.
Ngoài OALL, các mô hình Falcon-H1 Arabic còn đạt được kết quả xuất sắc trên các bộ tiêu chuẩn đánh giá chuyên biệt hơn, bao gồm: (i) 3LM dành cho khả năng lập luận STEM, (ii) ArabCulture dành cho khả năng hiểu văn hóa và bối cảnh, và (iii) AraDice (hiểu các phương ngữ).
Tổng thể, những kết quả này đánh dấu một bước đột phá cho trí tuệ nhân tạo tiếng Ả Rập. Falcon-H1 Arabic không chỉ vượt trội hơn các mô hình lớn hơn nhiều lần ở cả các bộ tiêu chuẩn tổng quát và chuyên biệt, mà còn thể hiện chiều sâu ngôn ngữ, khả năng lập luận và hiệu suất vượt trội, thiết lập một tiêu chuẩn mới cho lĩnh vực này. Điều này khẳng định Falcon-H1 Arabic là bộ mô hình ngôn ngữ tiếng Ả Rập mạnh mẽ và đa năng nhất từng được phát triển cho đến nay.
Tiến sĩ Hakim Hacid, Trưởng nhóm Nghiên cứu của Trung tâm Nghiên cứu Trí tuệ Nhân tạo và Kỹ thuật số (AIDRC) thuộc TII, cho biết: “Mô hình này phản ánh trọng tâm của chúng tôi trong việc xây dựng AI tiếng Ả Rập không chỉ tiên tiến hơn mà còn thực sự hữu ích trong các tình huống thực tế. Bằng cách nâng cao hiệu suất, chiều sâu khả năng hiểu và phạm vi ngôn ngữ, chúng tôi đang tạo điều kiện cho các hệ thống AI hỗ trợ tốt hơn cho các tổ chức, nhà phát triển và cộng đồng trong toàn khu vực.”
Mô hình này cũng mở rộng đáng kể độ dài ngữ cảnh, với cửa sổ lên đến 256K token, cho phép các mô hình xử lý lượng lớn thông tin trong một lần tương tác. Trên thực tế, điều này có nghĩa là người dùng có thể, ví dụ, phân tích các tài liệu pháp lý dài, ghi chú y tế, bài báo học thuật hoặc cơ sở tri thức doanh nghiệp mà không bị mất ngữ cảnh hoặc tính liên tục – một khả năng trước đây chưa từng đạt được ở quy mô như vậy.
Các mô hình Falcon AI của TII đã liên tục xếp hạng nhất trên các bảng xếp hạng khu vực và toàn cầu kể từ năm 2023, với Falcon-H1 Arabic hiện đang dẫn đầu Bảng xếp hạng Open Arabic LLM ở nhiều kích thước mô hình khác nhau. Những kết quả này chứng minh năng lực của TII trong việc xây dựng các năng lực AI tự chủ có thể cạnh tranh ở cấp độ toàn cầu cao nhất, đồng thời thúc đẩy vai trò dẫn đầu của Abu Dhabi nói riêng và UAE nói chung trong nghiên cứu và đổi mới AI tiếng Ả Rập.
Các mô hình mới hiện đã có thể truy cập trong playground thông qua giao diện công khai của TII tại: https://chat.falconllm.tii.ae.
Văn bản ngôn ngữ nguồn ban đầu của thông báo này là phiên bản chính thức, có thẩm quyền. Các bản dịch được cung cấp chỉ như một sự điều chỉnh thích nghi, và sẽ được tham chiếu chéo với văn bản ngôn ngữ nguồn, đây là phiên bản duy nhất của văn bản có hiệu lực pháp lý.
Jinan Warrayat
jinan.warrayat@tii.ae