Victoria Meven
victoria.meven@edelman.com
多模態功能將於2025年1月新增語音模式
技术创新研究所 (TII),隸屬於阿布達比高級科技研究委員會 (ATRC) 的全球領先應用研究中心,正式推出了Falcon 3,其開源大型語言模型 (LLM) 系列的最新版本。這項突破性的發佈為小型LLM設立了全新的表現標準,並通過使該模型能夠高效運行於包括筆記型電腦在內的輕型基礎設施上,實現了先進人工智慧的普及化。Falcon 3引入了更卓越的推理能力和增強的微調功能,使其成為一款更強大且更實用的AI模型。
Falcon 3旨在實現高效能人工智慧的普及化,提供既強大又高效的模型。該模型基於 14兆代幣進行訓練,這一數字是其前代模型5.5兆的兩倍多。Falcon 3在多項基準測試中表現出卓越的性能,尤其是在全球範圍內名列前茅,能夠在單一GPU上運行。在推出後,Falcon 3登上了Hugging Face全球第三方LLM排行榜的榜首,超越了其他同等規模的開源模型,包括Meta的Llama系列。特別是Falcon 3-10B模型在其類別中領先,表現超越了所有參數少於130億的模型。
ATRC秘書長兼阿聯酋總統戰略研究與先進技術事務顧問Faisal Al Bannai 閣下表示:「人工智慧的變革力量是不容否認的。今天,我們通過發布Falcon 3文本模型系列,進一步提升了我們對人工智慧社群,特別是開源領域的貢獻。這次發佈建立在我們Falcon 2奠定的基礎之上,標誌著邁向新一代人工智慧模型的重要一步。我們持續致力於確保這些強大的工具保持對全球每一個人無處不在的可用性,這反映了我們對全球公平與包容性創新的承諾。」
Falcon 3 系列
Falcon 3 系列包括四種模型尺寸:Falcon3-1B、-3B、-7B 和 -10B。與其前代模型相比,Falcon 3 對無縫整合投入了大量關注。這些模型完全相容於廣泛使用的 API(應用程式介面)和函式庫,大幅降低了整合難度,並確保使用上的便利性。這最終讓使用者能夠選擇最符合自身需求的解決方案。Falcon 3 在推理、語言理解、指令執行、程式碼生成及數學任務等方面展現出卓越的性能,有望在 AI 能力上樹立全新標準。
Falcon 3 的小型模型各自擁有 Base 和 Instruct 兩種變體,每種都在同尺寸中位居全球最強之列。Base 模型適用於通用生成任務,而 Instruct 是針對對話應用進行微調的變體。Falcon 3 支援英文、法文、西班牙文及葡萄牙文。Falcon 3 的模型還提供量化版本,能夠優化整合至專用架構,具備資源高效與輕量化的特性,以實現快速部署與推理。
TII 執行長Najwa Aaraj 博士表示:「我們對開創性研究的投入以及吸引頂尖人才的努力,最終促成了 Falcon 3 的研發。這一成果展現了我們對追求科學卓越的承諾,不僅提升了效率,還為 AI 技術樹立了新的標杆。」
TII 人工智慧和數位科學研究中心 (AIDRC) 首席研究員 Hakim Hacid 博士表示:「人工智慧正在快速發展,我們很高興能積極參與這段旅程。Falcon 3 將小型 LLM 的界限進一步推進,透過提供性能更佳的人工智慧,為開源社群作出貢獻。我們相信,這次的最新發佈將開啟無限的可能性,並帶來巨大的益處,讓企業和個人能以往昔難以實現的方式使用人工智慧。」
Falcon 3 現已可於 HuggingFace 和 FalconLLM.TII.ae 下載,同時可查看基準測試的詳細資訊。
TII 也推出了 Falcon Playground,這是一個供最終使用者、程式設計師、編碼人員和研究人員使用的測試環境,在 Falcon 3 正式發佈前進行探索,提供實驗和反饋的機會。
Falcon 3 採用 TII Falcon License 授權,這是一種基於 Apache 2.0 的寬鬆軟體授權,包含可接受的使用政策,旨在推廣負責任的 AI 使用行為。
2025 年 1 月上旬,Falcon 3 模型系列將推出新成員,著重於多模態功能,包括文字、圖片、影片和語音模式。
免責聲明:本公告之原文版本乃官方授權版本。譯文僅供方便瞭解之用,煩請參照原文,原文版本乃唯一具法律效力之版本。
Victoria Meven
victoria.meven@edelman.com