Jennifer Dewan, Giám đốc Truyền thông Cấp cao
Jennifer.dewan@tii.ae
(BUSINESS WIRE)-- Viện Đổi mới Công nghệ (TII), một trung tâm nghiên cứu khoa học hàng đầu thế giới và là trụ cột nghiên cứu ứng dụng của Hội đồng Nghiên cứu Công nghệ Tiên tiến (ATRC) của Abu Dhabi, đã phát hành một mô hình ngôn ngữ lớn mới trong dòng Falcon mang tên Falcon Mamba 7B. Mô hình mới là Mô hình Ngôn ngữ Không gian Trạng thái (SSLM) mã nguồn mở hoạt động số 1 trên toàn cầu, được xác minh độc lập bởi Hugging Face.
SSLM đầu tiên này của dòng Falcon khởi nguồn từ các mẫu Falcon trước đây đều sử dụng kiến trúc dựa trên transformer. Mô hình Falcon Mamba 7B mới này là một ví dụ khác về nghiên cứu tiên phong mà viện đang tiến hành cũng như các công cụ và sản phẩm đột phá mà viện cung cấp cho cộng đồng ở định dạng mã nguồn mở.
H.E. Faisal Al Bannai, Tổng thư ký ATRC kiêm Cố vấn cho Tổng thống UAE về Nghiên cứu Chiến lược và Các vấn đề Công nghệ Tiên tiến, cho biết: “Falcon Mamba 7B là mô hình AI được xếp hạng hàng đầu lần thứ tư liên tiếp của TII, củng cố vị thế của Abu Dhabi là một trung tâm toàn cầu về nghiên cứu và phát triển AI. Thành tựu này nêu bật cam kết bền vững của UAE đối với công cuộc đổi mới.”
Đối với các mô hình kiến trúc transformer, Falcon Mamba 7B vượt trội hơn Llama 3.1 8B, Llama 3 8B của Meta và Mistral 7B trên các tiêu chuẩn mới được giới thiệu từ HuggingFace. Trong khi đó đối với các SSLM khác, Falcon Mamba 7B đánh bại tất cả các mô hình mã nguồn mở khác trong các tiêu chuẩn cũ và sẽ là mô hình đầu tiên trên bảng xếp hạng tiêu chuẩn mới khắt khe hơn của HuggingFace.
Tiến sĩ Najwa Aaraj, Giám đốc điều hành của TII, cho biết: “Viện Đổi mới Công nghệ tiếp tục thúc đẩy ranh giới của công nghệ với loạt mô hình AI của Falcon. Falcon Mamba 7B đại diện cho công việc tiên phong thực sự và mở đường cho những đổi mới AI trong tương lai nhằm nâng cao năng lực của con người và cải thiện cuộc sống”.
Các mô hình State Space cực kỳ hiệu quả trong việc hiểu các tình huống phức tạp phát triển theo thời gian, chẳng hạn như một cuốn sách hoàn chỉnh. Điều này là nhờ SSLM không yêu cầu bộ nhớ bổ sung để xử lý các khối thông tin lớn như vậy.
Mặt khác, các mô hình dựa trên transformer rất hiệu quả trong việc ghi nhớ và sử dụng thông tin mà chúng đã xử lý trước đó theo một trình tự. Nhờ đó, các mô hình này có khả năng thực hiện xuất sắc các nhiệm vụ chẳng hạn như tạo nội dung, tuy nhiên, vì chúng phải so sánh mỗi từ với nhau nên đòi hỏi năng lực tính toán không hề nhỏ.
SSLM có thể tìm thấy các ứng dụng trong các lĩnh vực khác nhau như các nhiệm vụ ước tính, dự báo và điều khiển. Tương tự như các mô hình kiến trúc transformer, chúng cũng vượt trội trong các tác vụ Xử lý Ngôn ngữ Tự nhiên và có thể được áp dụng cho dịch máy, tóm tắt văn bản, thị giác máy tính và xử lý âm thanh.
Tiến sĩ Hakim Hacid, Quyền Trưởng nhóm Nghiên cứu của Đơn vị Liên Trung tâm AI thuộc TII, cho biết: “Với sự ra mắt của Falcon Mamba 7B, tôi tự hào về vai trò của hệ sinh thái hợp tác của TII trong việc thúc đẩy sự phát triển. Bản phát hành này thể hiện một bước tiến lớn, truyền cảm hứng cho những quan điểm mới mẻ và tiếp thêm động lực cho việc tìm kiếm các hệ thống thông minh. Tại TII, chúng tôi đang thúc đẩy ranh giới của cả SSLM và mô hình transformer để thúc đẩy sự đổi mới hơn nữa trong trí tuệ nhân tạo”.
Falcon LLM đã ghi nhận hơn 45 triệu lượt tải xuống, chứng tỏ sự thành công vượt trội của các mô hình. Falcon Mamba 7B sẽ được phát hành theo TII Falcon License 2.0, giấy phép phần mềm dựa trên Apache 2.0, bao gồm chính sách sử dụng được chấp nhận nhằm thúc đẩy sử dụng AI có trách nhiệm. Thông tin chi tiết hơn về mô hình mới có tại FalconLLM.TII.ae.
Bộ Sưu Tập Ảnh/Đa Phương Tiện Có Sẵn Tại: https://www.businesswire.com/news/home/54107705/en
Văn bản ngôn ngữ nguồn ban đầu của thông báo này là phiên bản chính thức, có thẩm quyền. Các bản dịch được cung cấp chỉ như một sự điều chỉnh thích nghi, và sẽ được tham chiếu chéo với văn bản ngôn ngữ nguồn, đây là phiên bản duy nhất của văn bản có hiệu lực pháp lý.
Jennifer Dewan, Giám đốc Truyền thông Cấp cao
Jennifer.dewan@tii.ae