OpenAI重磅發表多語言AI數據集，解決語言鴻溝問題

根據《 venturebeat 》報導，OpenAI 發表了一個多語言數據集，評估了語言模型在阿拉伯語、德語、史瓦希里文、孟加拉語和約魯巴語等 14 種語言中的表現。

該公司在開放數據平台 Hugging Face 上分享了多語言大規模多任務語言理解（MMMLU）數據集，這項新的評估建立在廣受歡迎的大規模多任務語言理解（MMLU）基準的基礎上，該基準測試了人工智慧系統在從數學到法律和電腦科學等57個學科中的知識，但僅限於英語。

對於 OpenAI 來說，MMMLU 數據集既是挑戰也是機遇。

一方面，該公司將自己定位為多語言人工智慧領域的領導者，提供的工具解決了當前人工智慧領域的一個關鍵缺口；另一方面，OpenAI 不斷變化的開放立場將繼續受到審查，因為它要在公益和私利之間游刃有餘。