人工智能最新研究:一種大語(yǔ)言模型加上評價(jià)框架帶來(lái)新數學(xué)發(fā)現
中新網(wǎng)北京12月15日電 (記者 孫自法)國際著(zhù)名學(xué)術(shù)期刊《自然》最新發(fā)表一篇人工智能研究論文稱(chēng),研究人員報告了一種方法,他們利用一個(gè)大語(yǔ)言模型(LLM)對一個(gè)著(zhù)名的數學(xué)問(wèn)題作出了新發(fā)現,并通過(guò)系統的、迭代的評估框架確保正確。這一方法或可改進(jìn)LLM用來(lái)解決問(wèn)題和學(xué)習新知識的途徑。
該論文介紹,基于人工智能的工具(例如LLM)有望加速科學(xué)發(fā)現,解決長(cháng)久存在的問(wèn)題,但它們有時(shí)受制于“幻覺(jué)”,導致作出看似合理但錯誤的陳述。加入一個(gè)評估步驟,系統地衡量潛在解決方案的準確性,使得靠LLM幫助應對復雜問(wèn)題成為可能。這些問(wèn)題一般需要可驗證且定義明確,使這一工具在數學(xué)科學(xué)中有潛在價(jià)值。
論文第一作者和通訊作者、Google DeepMind的Bernardino Romera-Paredes和Alhussein Fawzi與同事及合作者一起提出一種方法,稱(chēng)為FunSearch(因為它搜索函數空間),將一組產(chǎn)生創(chuàng )造性解決方案的LLM和一個(gè)作為檢查者以避免錯誤建議的評估程序結合起來(lái)。一個(gè)多次迭代此過(guò)程的演化方法,通過(guò)提供此前最佳解決辦法作為輸入來(lái)引導LLM,結果表明這種方法可以收斂到新的、可驗證的正確結果。他們將FunSearch應用到了著(zhù)名的上限集問(wèn)題(cap set problem,數學(xué)中涉及計數和排列領(lǐng)域的一個(gè)中心問(wèn)題),發(fā)現了超越最著(zhù)名上限集的大上限集新構造。
論文作者認為,FunSearch的成功關(guān)鍵是它會(huì )尋找描述如何解決一個(gè)問(wèn)題的程序,而非尋找解決辦法。因為FunSearch的結果是程序,結果易于人類(lèi)解釋和驗證,這意味著(zhù)該方法有望激發(fā)該領(lǐng)域的進(jìn)一步思考。
他們補充指出,目前,這個(gè)方法可能還不適合所有類(lèi)型的挑戰,但通過(guò)未來(lái)改進(jìn)或可使FunSearch應用于更大范圍的問(wèn)題。(完)
版權聲明:凡注明“來(lái)源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來(lái)源中國西藏網(wǎng)和署著(zhù)作者名,否則將追究相關(guān)法律責任。
- “中國為全球應對氣候變化作出巨大貢獻”
- 外媒:美國希望以色列三周左右結束在加沙的大規模戰斗
- “非中合作創(chuàng )造更加美好的未來(lái)”——訪(fǎng)肯尼亞內閣首席部長(cháng)兼外交和僑務(wù)部長(cháng)穆達瓦迪
- 歐盟決定開(kāi)啟烏克蘭入盟談判 烏總統歡呼“勝利”
- 校園反猶風(fēng)波不斷 美國眾議院要求哈佛大學(xué)校長(cháng)辭職
- “避開(kāi)中國”?美國企業(yè):難!
- “脫鉤斷鏈”是世界經(jīng)濟最大風(fēng)險
- 中國駐日本使館發(fā)言人就日方涉南海錯誤言論發(fā)表談話(huà)
- 美國上周20.2萬(wàn)人首次申領(lǐng)失業(yè)救濟金
- 澳大利亞遭遇熱浪 悉尼現40℃以上高溫