《電子技術應用》
您所在的位置:首頁 > 人工智能 > 業界動態 > 谷歌Gemini Deep Think AI獲官方認證奧數金牌

谷歌Gemini Deep Think AI獲官方認證奧數金牌

人類頂級的智力高地失守!
2025-07-22
來源:網易科技
關鍵詞: Google DeepMind AI OpenAI

7月22日消息,AI霸權之爭已達到新的頂峰,Google DeepMindOpenAI現在都聲稱,其模型可以征服國際數學奧林匹克競賽(IMO),這堪稱人類最艱難的智力挑戰之一。

美國時間周一,谷歌宣布其Gemini Deep Think AI在2025年IMO比賽中獲得了官方認證的金牌。而在幾天前,其競爭對手OpenAI也宣布,其模型在同樣的比賽中獲得了相同的頂級分數,但OpenAI的成績尚未經過正式認證。

這一突破標志著AI推理能力的一次巨大飛躍,證明了通用型AI模型能夠在解決復雜數學問題時達到人類頂尖水平。與此同時,這一進展也進一步加劇了兩大AI巨頭之間的競爭。

AI挑戰人類智力巔峰

國際數學奧林匹克(IMO)是全球最具聲望的青少年數學競賽,始于1959年,每年舉辦一次。每個參賽國派出六名頂尖中學生數學選手,他們需解答六個在代數、組合學、幾何學和數論等領域極其復雜的問題。其中,約8%的參賽者將獲得一枚聲望卓著的金牌。

近年來,IMO逐漸成為了AI系統的一個重要挑戰平臺,用以測試AI在數學問題解決和推理能力上的最新進展。去年,Google DeepMind的AlphaProof和AlphaGeometry 2聯合系統曾達到銀牌水平,解決了四個問題并獲得28分。這一突破依賴于專門的形式化語言,展示了AI在接近人類頂級數學推理能力方面的進展。

今年,Google DeepMind的Gemini模型提交的結果首次經過IMO協調員的官方評分和認證,評分標準與學生選手一致。在肯定今年學生選手所取得的顯著成就之余,谷歌也分享了Gemini在此次比賽中的突破性表現。

從銀牌到金牌:AI推理的飛躍

Gemini Deep Think的高級版本在2025年IMO中表現出色,完美解決了六個極難問題中的五個,獲得了總分35分,達到了金牌水平。這些解決方案已經在線公開,任何人都可以在線查看并驗證其正確性。

IMO主席格雷戈爾·多利納爾(Gregor Dolinar)教授表示:“我們可以確認,Google DeepMind已經達到了人們非常期待的里程碑,在滿分42分中獲得了35分——這是一個金牌分數。他們的解決方案在許多方面都令人驚嘆。IMO的評分員發現它們清晰、精確,且大多數都易于理解。”

與去年的成績相比,谷歌今年的成就具有里程碑意義。2024年,谷歌的AlphaGeometry和AlphaProof系統雖然達到了銀牌標準,但當時它們依賴于專家首先將問題從自然語言轉化為專用的領域語言(如Lean),而證明過程則需要反向操作,整個過程也需要兩到三天的計算時間。

1.png

今年,Gemini模型的一個關鍵創新是能夠全程使用自然語言進行操作,直接從官方的題目描述中生成嚴謹的數學證明。這一切都在嚴格的4.5小時比賽時間限制內完成。

“批量制造”真正的AI數學家?

OpenAI與谷歌都將最近在IMO上取得的成就視為通用AI的重要勝利。OpenAI研究員諾姆·布朗(Noam Brown)在社交媒體上表示:“恭喜Google DeepMind團隊在IMO上取得的成績!我認為他們的成功再次突顯了AI進步的速度。雖然他們的方法與我們有所不同,但這正顯示了AI研究領域可以探索的多樣化方向。這不僅是一個針對IMO的專門模型,而是一個融合了新型實驗性通用技術的推理型大語言模型。”

布朗的觀點得到了OpenAI同事們的認可。這表明,谷歌和OpenAI的基礎模型不僅僅是針對數學問題的狹義專家,更具備廣泛的能力,能夠應對多種復雜任務。

OpenAI選擇自行公布成績,凸顯了在“公司內部面臨挑戰的背景下,急于展現領導力”的巨大壓力。OpenAI首席執行官山姆·奧特曼(Sam Altman)也提到了這一成就的重要性:“當我們剛開始OpenAI時,這(指在IMO奪金)一直是一個夢想,但那個時候我們并不覺得它能夠實現。”此次成功有力地反擊了關于OpenAI正失去競爭力的言論。

而谷歌的系統則依賴于其新推出的Gemini Deep Think架構,這是一種增強型推理模式,專門用于處理復雜問題。它融合了谷歌最新的研究技術,包括“并行思維”,這種設置使模型能夠在給出最終答案之前,同時探索并結合多種可能的解決方案,而不是追求單一的、線性的思維鏈。

為了最大限度地發揮Deep Think的推理能力,谷歌還引入了最新的強化學習技術,使其能利用更多的多步驟推理、問題解決和定理證明的數據來進行學習。此外,谷歌為Gemini提供了一個經過精心篩選的高質量數學問題解決方案語料庫,并在其指令中添加了如何高效解決IMO問題的通用提示和技巧。

谷歌計劃將這一版本的Deep Think模型提供給一批受信任的測試人員,包括數學家,之后再向Google AI Ultra訂閱者推出。

AI與數學的未來

盡管取得了突破,但AI推理技術目前仍處于實驗階段。OpenAI研究員亞歷山大·韋(Alexander Wei)表示:“這一成就攻克了AI領域長期以來的一個重大挑戰,我很高興地分享OpenAI最新的實驗性推理型大語言模型已經在全球最具聲望的數學競賽中達到了金牌水平。”

Google DeepMind的高級研究科學家Thang Luong對未來充滿信心:“我們非常有信心,很快就能把模型交到我們所信任的測試人員手中,尤其是數學家,幫助他們解決更復雜的問題,之后再推出給更廣泛的用戶群體。”

Google DeepMind與數學界的合作正在持續進行,但AI為數學貢獻的潛力仍處于起步階段。通過讓AI系統能夠進行更加靈活和直觀的推理,谷歌正在一步步接近構建能解決更復雜和高級數學問題的AI。

盡管今年的工作完全基于自然語言的Gemini,谷歌仍在持續推進其他AI系統,包括AlphaGeometry和AlphaProof。

谷歌相信,那些結合了自然語言流暢性與嚴格推理的智能體,包括在形式化語言中經過驗證的推理,將成為數學家、科學家、工程師和研究人員不可或缺的工具,幫助推動人類知識的進步,并為通用人工智能(AGI)奠定基礎。


Magazine.Subscription.jpg

本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲一区二区成人| 一区二区久久久久| 亚洲日本无吗高清不卡| 国产一区二区你懂的| 国产精品自拍网站| 国产精品羞羞答答xxdd| 欧美日韩综合在线| 欧美日韩在线高清| 欧美视频一区二区三区| 欧美日韩欧美一区二区| 欧美日韩国产一区二区三区地区 | 午夜影院日韩| 亚洲综合999| 亚洲欧美在线免费观看| 亚洲免费在线观看| 欧美亚洲午夜视频在线观看| 亚洲欧美一区二区精品久久久| 亚洲免费在线播放| 欧美一级成年大片在线观看| 欧美伊久线香蕉线新在线| 欧美制服第一页| 老司机午夜精品视频在线观看| 久久综合色婷婷| 欧美国产大片| 欧美日韩喷水| 国产精品亚洲欧美| 国产亚洲午夜| 尤物精品在线| 亚洲乱码国产乱码精品精 | 亚洲欧洲日韩综合二区| 亚洲精品一区中文| 亚洲午夜伦理| 欧美在线免费| 美国成人直播| 欧美日韩亚洲另类| 国产精品伊人日日| 在线日韩视频| 9久草视频在线视频精品| 亚洲一区二区视频在线观看| 欧美中文字幕| 99精品欧美一区二区蜜桃免费| 亚洲午夜国产成人av电影男同| 亚洲欧美国产精品桃花 | 欧美/亚洲一区| 欧美丝袜第一区| 国产深夜精品福利| 亚洲成人中文| 亚洲一区二区三区乱码aⅴ| 欧美一区免费视频| 亚洲精品一区二区三区四区高清| 亚洲视频在线观看免费| 欧美中文在线观看国产| 欧美电影在线观看完整版| 国产精品福利在线观看| 伊人久久综合97精品| 亚洲最新中文字幕| 久久精品理论片| 亚洲一区二区三区视频播放| 久久精品91| 欧美日韩午夜剧场| 黄色成人91| 亚洲小少妇裸体bbw| 亚洲激情视频在线观看| 午夜伦理片一区| 欧美国产专区| 国产日韩精品在线播放| 亚洲人成精品久久久久| 午夜在线一区二区| 99视频精品在线| 久久嫩草精品久久久久| 欧美性淫爽ww久久久久无| 悠悠资源网亚洲青| 亚洲欧美日韩精品久久| 亚洲精品日韩综合观看成人91| 欧美亚洲视频一区二区| 欧美日本亚洲韩国国产| 激情欧美日韩| 午夜精品福利一区二区三区av| 亚洲最快最全在线视频| 久久综合99re88久久爱| 国产精品永久在线| 日韩视频中午一区| 亚洲日韩欧美视频| 久久精品国产久精国产思思| 欧美视频精品在线观看| 亚洲第一主播视频| 欧美在线观看网站| 欧美一级久久| 国产精品久久久久天堂| 亚洲激情偷拍| 亚洲国产精品成人一区二区 | 亚洲看片网站| 久久综合狠狠综合久久综合88 | 国产在线视频欧美| 亚洲综合成人在线| 亚洲午夜视频| 欧美绝品在线观看成人午夜影视| 黄色成人在线网站| 欧美一区二区三区四区视频| 亚洲在线一区| 欧美午夜宅男影院| 亚洲精品在线观看免费| 亚洲欧洲一区二区三区| 久久亚洲美女| 国语精品中文字幕| 欧美亚洲一区二区在线观看| 亚洲欧美不卡| 国产精品福利在线观看| 99热在线精品观看| 亚洲最新色图| 欧美日韩免费看| 99热免费精品| 亚洲午夜极品| 欧美视频在线播放| 一本色道久久综合亚洲精品高清 | 免费在线观看精品| 亚洲电影免费观看高清| 亚洲国产第一| 欧美高清在线视频| 亚洲精品1234| 一区二区三区四区五区在线| 欧美日韩国产精品自在自线| 亚洲国产精品久久| 日韩一二三区视频| 欧美日韩国产综合视频在线观看| 亚洲欧洲另类| 一区二区精品| 欧美午夜精品理论片a级按摩 | 国产老肥熟一区二区三区| 亚洲女性喷水在线观看一区| 欧美一区=区| 国产一区二区久久久| 久久精品视频在线观看| 麻豆精品在线观看| 亚洲国产毛片完整版 | 一区二区三区久久久| 欧美偷拍另类| 午夜精品成人在线| 久久中文字幕导航| 最近中文字幕日韩精品| 洋洋av久久久久久久一区| 国产精品hd| 亚洲欧美制服中文字幕| 久久综合久色欧美综合狠狠| 亚洲国产99| 亚洲一区二区欧美日韩| 国产精品午夜在线| 亚洲国产另类久久久精品极度| 欧美不卡视频| 一区二区三区欧美亚洲| 欧美在线亚洲| 亚洲第一狼人社区| 亚洲一区精品在线| 国产午夜亚洲精品理论片色戒| 亚洲国产美女精品久久久久∴| 欧美激情在线| 亚洲一区二区影院| 免费av成人在线| 一本色道久久综合狠狠躁篇的优点 | 久久精品国产99国产精品澳门| 欧美成人69av| 国产精品99久久不卡二区| 久久九九有精品国产23| 91久久一区二区| 欧美一区免费| 最新成人av网站| 久久av红桃一区二区小说| 亚洲国产精品成人| 午夜精品美女久久久久av福利| 激情久久久久久| 国产精品99久久不卡二区| 国产美女精品人人做人人爽| 亚洲激情校园春色| 国产精品毛片大码女人| 亚洲欧洲精品一区二区精品久久久| 欧美三级日本三级少妇99| 欧美在线播放| 国产精品扒开腿做爽爽爽软件| 亚洲第一精品福利| 国产精品护士白丝一区av| 亚洲经典在线| 国产区精品视频| 中文高清一区| 在线观看一区| 欧美制服第一页| 一本色道久久综合亚洲精品不卡| 久久视频国产精品免费视频在线| 日韩视频一区二区三区在线播放免费观看 | 欧美日韩国产欧| 久久精品国产77777蜜臀| 国产精品久久久对白| 91久久综合亚洲鲁鲁五月天| 国产精品美女久久久久久久| 亚洲精品综合| 国产一区二区三区在线免费观看 | 亚洲电影在线看| 久久久999精品视频| 亚洲婷婷在线| 欧美精品福利| 亚洲国产精品www|