OpenAI今日發(fā)布了兩款突破性AI模型,它們不僅能結(jié)合圖像進(jìn)行推理,還可自主調(diào)用工具。專家認(rèn)為,這標(biāo)志著人工智能能力的一次質(zhì)變。
這家總部位于舊金山的公司推出了o3和o4-mini,作為其"o系列"推理模型的最新成員。官方宣稱,這是迄今為止最智能、最強(qiáng)大的模型。這些系統(tǒng)能將圖像直接融入推理流程,在單一任務(wù)中完成網(wǎng)頁搜索、代碼運(yùn)行、文件分析乃至圖像生成等操作。
"有些模型會(huì)讓人感覺跨入了未來,GPT-4曾是這樣,今天也將成為這樣的日子。"OpenAI總裁Greg Brockman在發(fā)布會(huì)上表示,"頂尖科學(xué)家反饋稱,這些模型能產(chǎn)出真正優(yōu)質(zhì)且實(shí)用的創(chuàng)新想法。"
新模型如何"用圖像思考"革新視覺問題解決
最引人注目的功能是其"用圖像思考"的能力——不僅是識(shí)別圖像,更將其作為問題解決過程中的可操作元素。
"它們不只是'看'圖像,而是用圖像'思考'。"OpenAI在聲明中解釋道,"這解鎖了融合視覺與文本推理的全新問題解決方式。"
發(fā)布會(huì)演示環(huán)節(jié)中,研究員展示了o3如何分析一份十年前的物理實(shí)習(xí)海報(bào):自主解析復(fù)雜圖表后,它甚至發(fā)現(xiàn)最終結(jié)果并未體現(xiàn)在海報(bào)上。"它相當(dāng)于在幾秒內(nèi)替我閱讀了至少10篇論文。"OpenAI多模態(tài)推理研究員Brandon McKenzie表示,這項(xiàng)任務(wù)若由人工完成需耗時(shí)數(shù)日。
AI能在推理過程中縮放細(xì)節(jié)、旋轉(zhuǎn)圖表或裁剪冗余元素,這種主動(dòng)的圖像操控能力被行業(yè)分析師認(rèn)為將變革從科研到教育的多個(gè)領(lǐng)域。
超越模型:o3與o4-mini作為完整AI系統(tǒng)的工具鏈集成
OpenAI強(qiáng)調(diào),這些發(fā)布不僅是模型升級(jí),更是能自主串聯(lián)多工具的完整AI系統(tǒng)。"我們通過強(qiáng)化學(xué)習(xí)訓(xùn)練它們不僅會(huì)使用工具,還能判斷何時(shí)使用。"公司解釋道。
Brockman舉例說明:"在解決難題時(shí),o3曾連續(xù)調(diào)用600次工具。"這種能力使模型無需人工干預(yù)即可完成復(fù)雜工作流。例如詢問加州未來能源使用趨勢(shì)時(shí),AI能自動(dòng)搜索公用數(shù)據(jù)、編寫Python分析代碼、生成可視化圖表并整合成報(bào)告。
OpenAI以破紀(jì)錄性能領(lǐng)跑AI競(jìng)賽
o3在Codeforces、SWE-bench和MMMU等關(guān)鍵基準(zhǔn)測(cè)試中刷新紀(jì)錄。獨(dú)立評(píng)估顯示,其在復(fù)雜現(xiàn)實(shí)任務(wù)中的重大錯(cuò)誤率比前代降低20%。
輕量化的o4-mini在速度與成本效率上表現(xiàn)突出。使用Python解釋器時(shí),其在2025年AIME數(shù)學(xué)競(jìng)賽中取得99.5%的準(zhǔn)確率。
此次發(fā)布恰逢OpenAI推出專精編程的GPT-4.1后僅兩天,凸顯AI領(lǐng)域競(jìng)爭(zhēng)白熱化。面對(duì)谷歌Gemini、AnthropicClaude和馬斯克xAI的追趕,OpenAI上月剛完成創(chuàng)紀(jì)錄的400億美元融資,估值達(dá)3000億美元。據(jù)悉,公司還考慮建設(shè)自有社交網(wǎng)絡(luò)以獲取專屬訓(xùn)練數(shù)據(jù)。
新模型如何以代碼導(dǎo)航能力變革軟件工程
Brockman坦言:"o3在導(dǎo)航OpenAI代碼庫時(shí)比我更高效。"同步發(fā)布的還有開源工具Codex CLI,開發(fā)者可通過終端直接調(diào)用模型推理能力,支持上傳截圖或草圖輔助編程。為推廣使用,OpenAI設(shè)立100萬美元基金,為優(yōu)秀項(xiàng)目提供2.5萬美元API代金券。
OpenAI的安全防護(hù)體系
公司宣稱已對(duì)模型進(jìn)行史上最嚴(yán)格安全測(cè)試,包括重構(gòu)安全訓(xùn)練數(shù)據(jù)集和開發(fā)系統(tǒng)級(jí)風(fēng)險(xiǎn)標(biāo)記機(jī)制。測(cè)試顯示,o3與o4-mini在生物、網(wǎng)絡(luò)安全和AI自我進(jìn)化等高風(fēng)險(xiǎn)領(lǐng)域的潛在威脅均低于"高"閾值。
開放計(jì)劃與商業(yè)策略
ChatGPT Plus、Pro和Team用戶即日可用,企業(yè)和教育客戶下周開放。免費(fèi)用戶提交查詢前選擇"思考"選項(xiàng)可體驗(yàn)o4-mini。開發(fā)者可通過Chat Completions API和Responses API接入,部分機(jī)構(gòu)需驗(yàn)證權(quán)限。
AI未來:推理與對(duì)話的融合
OpenAI指出,此次更新標(biāo)志著"o系列的專業(yè)推理能力與GPT系列的自然對(duì)話及工具使用正在融合"。沃頓商學(xué)院研究AI應(yīng)用的Ethan Mollick教授評(píng)價(jià)o3為"強(qiáng)大但仍有棱角的模型"。
當(dāng)AI開始像人類一樣將視覺信息作為思維素材而不僅是分析對(duì)象時(shí),這種從被動(dòng)識(shí)別到主動(dòng)視覺推理的跨越,或許比任何基準(zhǔn)分?jǐn)?shù)都更具深遠(yuǎn)意義——這標(biāo)志著AI首次真正通過"思考的眼睛"觀察世界。
精選文章:
AI生成字體:機(jī)器正在設(shè)計(jì)字體的未來嗎?
當(dāng)代海報(bào)設(shè)計(jì)趨勢(shì):大膽字體與鮮艷色彩的視覺革命
為人而設(shè)計(jì):卓越用戶體驗(yàn)背后的心理學(xué)