OpenAI重磅發表多語言AI數據集,解決語言鴻溝問題
品玩 / 何渝婷編譯
2024-09-24 13:40

根據《 venturebeat 》報導,OpenAI 發表了一個多語言數據集,評估了語言模型在阿拉伯語、德語、史瓦希里文、孟加拉語和約魯巴語等 14 種語言中的表現。

該公司在開放數據平台 Hugging Face 上分享了多語言大規模多任務語言理解(MMMLU)數據集,這項新的評估建立在廣受歡迎的大規模多任務語言理解(MMLU)基準的基礎上,該基準測試了人工智慧系統在從數學到法律和電腦科學等57個學科中的知識,但僅限於英語。

對於 OpenAI 來說,MMMLU 數據集既是挑戰也是機遇。

一方面,該公司將自己定位為多語言人工智慧領域的領導者,提供的工具解決了當前人工智慧領域的一個關鍵缺口;另一方面,OpenAI 不斷變化的開放立場將繼續受到審查,因為它要在公益和私利之間游刃有餘。

本文為品玩授權刊登,原文標題為「OpenAI 重磅發佈多語言 AI 數據集,解決語言鴻溝問題