行尸走肉第七季在线观看免费完整版美剧网,青春变形记电影在线观看完整版免费,敌后奇兵电视剧在线观看,久久久片,阿凡达二在线观看完整版免费,教父2电影在线观看高清完整版国语,沙丘1在线观看免费完整版电影

首頁 > 產(chǎn)業(yè)市場 > 即時新聞

星火高考評測第一,背后是訊飛二十年教育深耕

2026-06-12 22:03 來源:中國經(jīng)濟網(wǎng)
查看余下全文
首頁 > 產(chǎn)業(yè)市場 > 即時新聞

星火高考評測第一,背后是訊飛二十年教育深耕

2026年06月12日 22:03 來源:中國經(jīng)濟網(wǎng)
[字號 ]

2026年高考結(jié)束后,多家媒體陸續(xù)組織了一場特殊的“AI高考”。不同于過去單純讓大模型寫一篇作文、解幾道題,今年的評測更接近真實考試場景:同一套試題、相同提示詞、關(guān)閉聯(lián)網(wǎng)或限定條件、邀請一線教師和專家按照高考閱卷標準評分。

從目前公開的多項測評結(jié)果看,訊飛星火大模型在數(shù)學、中文作文、英文寫作三個維度都進入第一梯隊,并在數(shù)學評測中表現(xiàn)最為突出。

6月8日,在新京報組織的2026年新高考I卷數(shù)學評測中,訊飛星火以148分位列第一。參與評測的北京市中學數(shù)學特級教師點評,壓軸題成為區(qū)分模型復雜推理能力的分水嶺,訊飛星火在數(shù)形結(jié)合、圖形幾何性質(zhì)研究等方面明顯優(yōu)于其他模型。

在語文作文方面,澎湃新聞6月7日組織9款國內(nèi)外主流大模型挑戰(zhàn)上海卷作文,訊飛星火以65.5分位列第一。南方日報、南方Plus6月7日相關(guān)測評中,訊飛星火在全國I卷作文評測中以55.5分居首。6月10日,觀察者網(wǎng)組織的中英作文盲評,訊飛星火在語文新課標I卷作文和英語新課標I卷應用文寫作中同樣處于第一梯隊。

這次高考評測真正有價值的地方,不是又給大模型排了一次名,而是它把大模型拉回了一個真實標準之中:高考不是普通問答,閱卷也不是只看最終結(jié)果。數(shù)學要看步驟,作文要看審題、立意、結(jié)構(gòu)和表達,英語寫作要看任務完成度、語言準確性和應用文規(guī)范。換句話說,大模型要在高考中拿高分,不僅要“會”,還要“像一個懂考試、懂評分、懂教學的人那樣會”。

從這個角度看,訊飛星火的領(lǐng)先并不意外。

首先,它反映出訊飛星火在復雜推理能力上的持續(xù)進化。數(shù)學是最能檢驗大模型底層能力的科目之一,很多模型在基礎題上差距并不大,真正拉開差距的是后半程。尤其是新高考I卷中的解答題和壓軸題,對模型提出的要求已經(jīng)遠超簡單計算。模型不僅要讀懂題意,還要在較長邏輯鏈條中保持穩(wěn)定,不能遺漏條件,不能跳步推理,不能在幾何、代數(shù)、函數(shù)之間切換時丟失方向。訊飛星火在第18、19題等高難度題目上表現(xiàn)更加完整,體現(xiàn)出復雜問題拆解、多步驟推理和過程表達能力。對于一個大模型而言,能算出答案只是第一步,能把解題路徑穩(wěn)定、清楚、規(guī)范地表達出來,才更接近真實應用。

但如果只把訊飛星火的表現(xiàn)歸結(jié)為“模型能力強”,仍然是不夠的。2026年高考評測更重要的啟示在于,教育不是一個可以靠通用模型直接“平推”的場景。它有自己的規(guī)則、標準、數(shù)據(jù)、評價體系和用戶習慣。訊飛星火之所以在高考評測中表現(xiàn)穩(wěn)定,很大程度上來自科大訊飛多年深耕教育場景形成的know-how。

科大訊飛不是從大模型時代才進入教育。更準確地說,星火今天在高考評測中的表現(xiàn),背后站著的是訊飛二十多年“AI+教育”的長期積累。

公開資料顯示,科大訊飛智慧教育業(yè)務開始于2004年。也就是說,在生成式人工智能成為公共話題之前,訊飛已經(jīng)長期圍繞課堂教學、考試評價、學生學習、教師發(fā)展和區(qū)域教育治理等場景展開布局。教育行業(yè)與普通互聯(lián)網(wǎng)產(chǎn)品不同,它不是一個只要技術(shù)先進就能快速替代的市場,而是一個高度依賴真實場景、教學規(guī)律和評價標準的系統(tǒng)。誰真正進入過課堂,誰真正服務過老師、學生和區(qū)域教育管理者,誰才更有可能理解一道題背后的教學目標、評分標準和學生常見錯誤。

這種積累首先體現(xiàn)在課堂場景。近年來,訊飛AI黑板、智慧課堂等產(chǎn)品持續(xù)進入中小學教學一線。科技日報曾報道,訊飛AI黑板所屬智慧窗系列產(chǎn)品已經(jīng)覆蓋全國多個省級行政區(qū)、1200多個區(qū)縣、超過10萬個班級,并在中國人民大學附屬中學、中國科大附中高新中學等學校深度應用。AI黑板并不是簡單把傳統(tǒng)黑板換成電子屏,而是把備課、授課、互動、資源調(diào)取和課堂反饋連接起來。對大模型而言,這意味著它面對的不是抽象的教育文本,而是課前、課中、課后的完整教學鏈條。

更重要的是,課堂數(shù)據(jù)會讓AI理解教學過程。一堂課為什么這樣導入,老師為什么在某個知識點停留,學生在哪類題型上容易出錯,哪些提問能激發(fā)思考,哪些講解方式更容易被接受,這些都不是通用語料能夠充分提供的。教育場景中的AI能力,必須來自真實教學過程的長期浸泡。

第二個關(guān)鍵場景是作業(yè)和考試評價。高考評測看似是大模型答題,實質(zhì)上是對“答案生成能力”和“評分標準理解能力”的雙重檢驗。公開報道顯示,星火智能批閱機已在全國3000多所學校深度應用,讓教師從繁瑣的作業(yè)批改中抽身,同時,系統(tǒng)沉淀的豐富批改數(shù)據(jù),能夠形成班級、年級乃至全校的學情分析報告,幫助教研團隊精準把握教學現(xiàn)狀,調(diào)整教學重難點,實現(xiàn)“以學定教”,打通了“作業(yè)批改——學情分析——精準施教”的完整閉環(huán),讓因材施教不再停留在理念層面,而是落地為可執(zhí)行、可追蹤、可優(yōu)化的日常教學模式。

第三個場景是個性化學習。訊飛AI學習機、個性化學習方案和因材施教綜合解決方案,連接的是學生在校內(nèi)外的學習閉環(huán)。訊飛AI學習機公開介紹中提到,其融合AI技術(shù)、校內(nèi)大數(shù)據(jù)精準教學方案及中高考標準,面向?qū)W生提供AI 1對1精準學和AI 1對1答疑輔導。

第四個場景是區(qū)域教育治理。訊飛智慧教育公開資料顯示,其產(chǎn)品與服務已經(jīng)覆蓋全國33個省級行政區(qū),深度應用學校6萬余所,累計服務師生超過1.6億,并形成覆蓋區(qū)域、學校和家庭的智慧教育生態(tài)體系。區(qū)域教育治理與單個產(chǎn)品不同,它關(guān)注的是更宏觀的問題:如何提升區(qū)域教育質(zhì)量,如何推動優(yōu)質(zhì)資源均衡,如何讓管理者基于數(shù)據(jù)發(fā)現(xiàn)薄弱學校、薄弱學科和薄弱知識點,如何幫助教師減負增效。

這類場景會進一步加深訊飛對中國教育體系的理解。高考不是孤立的考試,而是基礎教育教學目標、課程標準、評價體系和學生能力培養(yǎng)的集中體現(xiàn)。只有長期參與區(qū)域教育數(shù)字化建設,才能真正理解不同地區(qū)、不同學校、不同學生群體在教學與評價中的真實需求。

因此,訊飛星火在2026年高考評測中拿下第一,并不是一次孤立的技術(shù)勝出。它背后不是簡單的參數(shù)規(guī)模競爭,而是通用大模型能力與教育行業(yè)know-how的結(jié)合。

當大模型進入教育,真正的競爭不只是模型能力,而是模型背后的教育理解能力??拼笥嶏w多年教育場景深耕,使訊飛星火不是一個臨時參加高考的大模型,而是一個長期在教學、考試、評價和學習場景中成長起來的大模型。

(責任編輯:佟明彪)