Jennifer Dewan, Giám đốc Truyền thông Cấp cao
Jennifer.dewan@tii.ae
Hôm nay, Viện Đổi mới Công nghệ (TII), trung tâm nghiên cứu khoa học hàng đầu thế giới, trụ cột nghiên cứu ứng dụng của Hội đồng Nghiên cứu Công nghệ Tiên tiến (ATRC) Abu Dhabi, đã cho ra mắt phiên bản thứ hai của mô hình ngôn ngữ lớn (LLM) nổi tiếng - Falcon 2. Trong loạt sản phẩm được cho ra mắt này, TII đã tiết lộ hai phiên bản đột phá: Falcon 2 11B, mô hình ngôn ngữ lớn hiệu quả hơn và dễ tiếp cận hơn được đào tạo trên 5,5 nghìn tỷ mã thông báo với 11 tỷ thông số và Falcon 2 11B VLM, mô hình tạo ra sự khác biệt với khả năng chuyển đổi hình ảnh sang ngôn ngữ (VLM), cho phép chuyển đổi liền mạch các đầu vào trực quan thành đầu ra văn bản. Mặc dù cả hai đều là các mô hình đa ngôn ngữ, nhưng đáng chú ý, Falcon 2 11B VLM lại là mô hình đa phương thức đầu tiên của TII và cũng là mô hình duy nhất hiện tại ở thị trường cấp cao nhất có khả năng chuyển đổi hình ảnh thành văn bản, đánh dấu một bước tiến đáng kể trong đổi mới AI.
Sau khi thử nghiệm với một số mô hình AI nổi bật trong số các mô hình được đã đào tạo trước, Falcon 2 11B có hiệu suất vượt trội hơn Llama 3 mới ra mắt của Meta với 8 tỷ thông số (8B) và có khả năng ngang bằng với Gemma 7B của Google để giành vị thế dẫn đầu (Falcon 2 11B : 64,28 trong khi Gemma 7B: 64,29), được xác minh độc lập bởi Hugging Face, một nền tảng có trụ sở tại Hoa Kỳ, là một công cụ đánh giá khách quan và cũng cung cấp bảng xếp hạng toàn cầu cho các mô hình ngôn ngữ lớn mở. Quan trọng hơn, Falcon 2 11B và 11B VLM đều là các mô hình mã nguồn mở, cho phép các nhà phát triển trên toàn thế giới truy cập không hạn chế. Trong tương lai gần, các mô hình thế hệ tiếp theo của Falcon 2 theo kế hoạch sẽ tiếp tục được mở rộng, cho ra mắt một loạt các kích cỡ khác nhau. Các mô hình này sẽ được tăng cường hơn nữa với các khả năng máy học tiên tiến như 'Hỗn hợp các chuyên gia' (Mixture of Experts, MoE), nhằm mục đích đẩy hiệu suất của chúng lên mức tinh vi hơn nữa.
Tất cả các mô hình AI của TII được phát hành cho đến nay đã liên tục được xếp hạng trong nhóm dẫn đầu trên toàn cầu, là mô hình ngôn ngữ lớn nguồn mở mạnh mẽ nhất. Các mô hình Falcon 2 11B linh hoạt và thu nhỏ mới được thiết lập, giúp TII được chấp nhận rộng rãi hơn trên thị trường trong thế giới ngày càng phát triển của AI.
Các mẫu Falcon 2 11B, được trang bị khả năng đa ngôn ngữ, giải quyết các nhiệm vụ bằng tiếng Anh, Pháp, Tây Ban Nha, Đức, Bồ Đào Nha và nhiều ngôn ngữ khác nhau, làm phong phú thêm tính linh hoạt và tăng hiệu quả trong các tình huống khác nhau. Falcon 2 11B VLM, một mô hình có khả năng chuyển đổi hình ảnh sang ngôn ngữ, có khả năng xác định và giải thích hình ảnh từ môi trường, đem lại một loạt các ứng dụng trong các ngành như y tế, tài chính, thương mại điện tử, giáo dục và các lĩnh vực pháp lý. Các ứng dụng này bao gồm từ quản lý tài liệu, lưu trữ kỹ thuật số và lập chỉ mục ngữ cảnh để hỗ trợ người khiếm thị. Hơn nữa, các mô hình này có thể chạy hiệu quả chỉ trên một bộ xử lý đồ họa (GPU), giúp chúng có khả năng mở rộng cao, đồng thời dễ dàng triển khai và tích hợp vào các cơ sở hạ tầng nhẹ hơn như máy tính xách tay và các thiết bị khác.
Ngài Faisal Al Bannai, Tổng thư ký ATRC và Cố vấn Nghiên cứu Chiến lược và Công nghệ Tiên tiến cho Tổng thống UAE, cho biết: "Thông qua việc phát hành Falcon 2 11B, chúng tôi đã cho ra mắt mô hình đầu tiên trong loạt Falcon 2. Mặc dù Falcon 2 11B đã thể hiện hiệu suất vượt trội nhưng chúng tôi vẫn tái khẳng định cam kết của mình đối với phong trào mã nguồn mở và với Tổ chức Falcon. Các mô hình đa phương thức khác sẽ sớm ra mắt thị trường với nhiều quy mô khác nhau. Mục đích của chúng tôi là đảm bảo rằng các nhà phát triển và tổ chức coi trọng quyền riêng tư của họ có quyền truy cập vào một trong những mô hình AI tốt nhất để hỗ trợ hành trình AI của mình."
Phát biểu về mô hình này, Tiến sĩ Hakim Hacid, Giám đốc Điều hành kiêm Quyền nghiên cứu viên chính của Đơn vị AI Cross-Center tại TII, cho biết: “AI liên tục phát triển và các nhà phát triển đang nhận ra vô số lợi ích của các mô hình nhỏ hơn, hiệu quả hơn. Ngoài việc giảm yêu cầu về sức mạnh tính toán và đáp ứng các tiêu chí về tính bền vững, các mô hình này còn linh hoạt hơn, tích hợp liền mạch với cơ sở hạ tầng AI tiên tiến, một xu hướng siêu mới nổi tiếp theo. Hơn nữa, khả năng chuyển hình ảnh sang ngôn ngữ của Falcon 2 mở ra chân trời mới cho khả năng tiếp cận trong AI, trao quyền cho người dùng với các tương tác hình ảnh chuyển đổi thành văn bản.”
Tính linh hoạt của Falcon 2 11B cũng đã khiến TII xem xét nghiên cứu các cải tiến thú vị hơn của GenAI. Trong số đó, TII sẽ áp dụng một loại khả năng máy học mới được gọi là 'Hỗn hợp Các chuyên gia' đã nói ở trên. Phương pháp này liên quan đến việc kết hợp các mạng nhỏ hơn với các chuyên môn riêng biệt, đảm bảo rằng chuyên gia trong các lĩnh vực có hiểu biết tốt nhất sẽ hợp tác để đưa ra các phản hồi tùy chỉnh và phức tạp - gần giống như việc có một nhóm hỗ trợ thông minh, mỗi người am hiểu một vấn đề khác nhau và làm việc cùng nhau để dự đoán hoặc đưa ra quyết định khi cần thiết. Cách tiếp cận này không chỉ cải thiện độ chính xác mà còn tăng tốc độ ra quyết định, mở đường cho các hệ thống AI thông minh và hiệu quả hơn.
Falcon 2 11B được cấp phép theo Giấy phép TII Falcon 2.0, giấy phép phần mềm dựa trên Apache 2.0, bao gồm chính sách sử dụng được chấp nhận nhằm thúc đẩy việc sử dụng AI có trách nhiệm. Bạn có thể tìm hiểu thêm thông tin về mô hình mới tại FalconLLM.TII.ae.
Văn bản ngôn ngữ nguồn ban đầu của thông báo này là phiên bản chính thức, có thẩm quyền. Các bản dịch được cung cấp chỉ như một sự điều chỉnh thích nghi, và sẽ được tham chiếu chéo với văn bản ngôn ngữ nguồn, đây là phiên bản duy nhất của văn bản có hiệu lực pháp lý.
Jennifer Dewan, Giám đốc Truyền thông Cấp cao
Jennifer.dewan@tii.ae