國內(nèi)首個(gè)網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái)SecBench發(fā)布
摘要: SecBench:首個(gè)網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái)發(fā)布
2024年1月19日,業(yè)界首個(gè)網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái)SecBench正式發(fā)布,該平臺(tái)由騰訊朱雀實(shí)驗(yàn)室和騰訊安全科恩實(shí)驗(yàn)室,聯(lián)合騰訊混元大模型、清華大學(xué)江勇教授/夏樹濤教授團(tuán)隊(duì)、香港理工大學(xué)羅夏樸教授研究團(tuán)隊(duì)、上海人工智能實(shí)驗(yàn)室OpenCompass團(tuán)隊(duì)共同建設(shè),主要解決開源大模型在網(wǎng)絡(luò)安全應(yīng)用中安全能力的評(píng)估難題,旨在為大模型在安全領(lǐng)域的落地應(yīng)用選擇基座模型提供參考,加速大模型落地進(jìn)程。同時(shí),通過建設(shè)安全大模型評(píng)測(cè)基準(zhǔn),為安全大模型研發(fā)提供公平、公正、客觀、全面的評(píng)測(cè)能力,推動(dòng)安全大模型建設(shè)。
行業(yè)首發(fā),彌補(bǔ)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域評(píng)測(cè)空白
自2022年11月ChatGPT發(fā)布以來,AI大模型在全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮,大模型的落地進(jìn)程也隨之加速。然而,在網(wǎng)絡(luò)安全應(yīng)用中,大模型研發(fā)人員如何選擇合適的基座模型,當(dāng)前大模型的安全能力是否已經(jīng)達(dá)到業(yè)務(wù)應(yīng)用需求,都成為亟待解決的問題。
SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái),將重點(diǎn)從能力、語言、領(lǐng)域、安全證書考試四個(gè)維度對(duì)大模型在網(wǎng)絡(luò)安全領(lǐng)域的各方面能力進(jìn)行評(píng)估,為大模型研發(fā)人員、學(xué)術(shù)研究者提供高效、公正的基座模型選型工具和研究參考。
一是積累行業(yè)獨(dú)有的網(wǎng)絡(luò)安全評(píng)測(cè)數(shù)據(jù)集。評(píng)測(cè)數(shù)據(jù)是評(píng)測(cè)基準(zhǔn)建設(shè)的基礎(chǔ),也是大模型能力評(píng)測(cè)最關(guān)鍵的部分。目前行業(yè)內(nèi)還沒有專門針對(duì)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域的評(píng)測(cè)基準(zhǔn)/框架,主要原因也是由于評(píng)測(cè)收據(jù)缺失的問題。因此,構(gòu)建網(wǎng)絡(luò)安全大模型評(píng)測(cè)基準(zhǔn)的首要目標(biāo)是積累行業(yè)內(nèi)獨(dú)有的網(wǎng)絡(luò)安全評(píng)測(cè)數(shù)據(jù)集,覆蓋多語言、多題型、多能力、多領(lǐng)域,以全面地評(píng)測(cè)大模型安全能力。
二是搭建方便快捷的網(wǎng)絡(luò)安全大模型評(píng)測(cè)框架。“百模大戰(zhàn)”下,大模型的形態(tài)各異,有HuggingFace上不斷涌現(xiàn)的開源大模型,有類似GPT-4、騰訊混元、文心一言等大模型API服務(wù),以及自研本地部署的大模型。評(píng)測(cè)框架如何支持各類大模型的快速接入、快速評(píng)測(cè)也很關(guān)鍵。此外,評(píng)測(cè)數(shù)據(jù)的多樣性也挑戰(zhàn)著評(píng)測(cè)框架的靈活性,例如,選擇題和問答題往往需要不同的prompt和評(píng)估指標(biāo),如何快速對(duì)比few shot和zero shot的差異。因此,需要搭建方便快捷的網(wǎng)絡(luò)安全大模型評(píng)測(cè)框架,以支持不同模型、不同數(shù)據(jù)、不同評(píng)測(cè)指標(biāo)的靈活接入、快速評(píng)測(cè)。
三是輸出全面、清晰的評(píng)測(cè)結(jié)果。網(wǎng)絡(luò)安全大模型研發(fā)的不同階段其實(shí)對(duì)評(píng)測(cè)的需求不同。例如,在研發(fā)初期進(jìn)行基座模型選型階段,通常只需要了解各類基座模型的能力排名、對(duì)比不同模型能力差異;而在網(wǎng)絡(luò)安全大模型研發(fā)階段,就需要了解每次迭代模型能力的變化,仔細(xì)分析評(píng)估結(jié)果等。因此,網(wǎng)絡(luò)大模型評(píng)測(cè)需要輸出全面、清晰的評(píng)測(cè)結(jié)果,如評(píng)測(cè)榜單、能力對(duì)比、中間結(jié)果等,以支持不同研發(fā)階段的需求。
SecBench除了圍繞上述三個(gè)目標(biāo)進(jìn)行建設(shè)外,還設(shè)計(jì)了兩個(gè)網(wǎng)絡(luò)安全特色能力:安全領(lǐng)域評(píng)測(cè)和安全證書考試評(píng)估。安全領(lǐng)域評(píng)測(cè)從垂類安全視角,評(píng)測(cè)大模型在九個(gè)安全領(lǐng)域的能力;安全證書考試評(píng)估支持經(jīng)典證書考試評(píng)估,評(píng)測(cè)大模型通過安全證書考試的能力。
當(dāng)前SecBench評(píng)測(cè)數(shù)據(jù)仍然存在多樣性不足、分布不均勻等問題,當(dāng)前正在持續(xù)補(bǔ)充建設(shè)多題型、多能力、多維度的評(píng)測(cè)數(shù)據(jù)。
隨著大模型在網(wǎng)絡(luò)安全領(lǐng)域的落地應(yīng)用加速,網(wǎng)絡(luò)安全大模型的評(píng)測(cè)變得尤為關(guān)鍵。SecBecnch已初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評(píng)測(cè)能力,以更好地支持網(wǎng)絡(luò)安全大模型的研發(fā)及落地應(yīng)用。此外為評(píng)估大模型在Prompt安全方面的表現(xiàn),騰訊朱雀實(shí)驗(yàn)室已聯(lián)合清華大學(xué)深圳國際研究生院,發(fā)布了《大語言模型(LLM) 安全性測(cè)評(píng)基準(zhǔn)》。
行業(yè)首發(fā),彌補(bǔ)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域評(píng)測(cè)空白
自2022年11月ChatGPT發(fā)布以來,AI大模型在全球范圍內(nèi)掀起了有史以來規(guī)模最大的人工智能浪潮,大模型的落地進(jìn)程也隨之加速。然而,在網(wǎng)絡(luò)安全應(yīng)用中,大模型研發(fā)人員如何選擇合適的基座模型,當(dāng)前大模型的安全能力是否已經(jīng)達(dá)到業(yè)務(wù)應(yīng)用需求,都成為亟待解決的問題。
SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)平臺(tái),將重點(diǎn)從能力、語言、領(lǐng)域、安全證書考試四個(gè)維度對(duì)大模型在網(wǎng)絡(luò)安全領(lǐng)域的各方面能力進(jìn)行評(píng)估,為大模型研發(fā)人員、學(xué)術(shù)研究者提供高效、公正的基座模型選型工具和研究參考。

圖 1. SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)整體設(shè)計(jì)架構(gòu)

圖 2. GPT-4在能力維度、語言維度以及安全領(lǐng)域能力的評(píng)估結(jié)果

圖 3. GPT-4在各類安全證書考試中的評(píng)估結(jié)果(綠色為通過考試)
SecBench設(shè)計(jì)架構(gòu)
圖1. 為SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)初期規(guī)劃的架構(gòu),主要圍繞三個(gè)維度進(jìn)行構(gòu)建:一是積累行業(yè)獨(dú)有的網(wǎng)絡(luò)安全評(píng)測(cè)數(shù)據(jù)集。評(píng)測(cè)數(shù)據(jù)是評(píng)測(cè)基準(zhǔn)建設(shè)的基礎(chǔ),也是大模型能力評(píng)測(cè)最關(guān)鍵的部分。目前行業(yè)內(nèi)還沒有專門針對(duì)大模型在網(wǎng)絡(luò)安全垂類領(lǐng)域的評(píng)測(cè)基準(zhǔn)/框架,主要原因也是由于評(píng)測(cè)收據(jù)缺失的問題。因此,構(gòu)建網(wǎng)絡(luò)安全大模型評(píng)測(cè)基準(zhǔn)的首要目標(biāo)是積累行業(yè)內(nèi)獨(dú)有的網(wǎng)絡(luò)安全評(píng)測(cè)數(shù)據(jù)集,覆蓋多語言、多題型、多能力、多領(lǐng)域,以全面地評(píng)測(cè)大模型安全能力。
二是搭建方便快捷的網(wǎng)絡(luò)安全大模型評(píng)測(cè)框架。“百模大戰(zhàn)”下,大模型的形態(tài)各異,有HuggingFace上不斷涌現(xiàn)的開源大模型,有類似GPT-4、騰訊混元、文心一言等大模型API服務(wù),以及自研本地部署的大模型。評(píng)測(cè)框架如何支持各類大模型的快速接入、快速評(píng)測(cè)也很關(guān)鍵。此外,評(píng)測(cè)數(shù)據(jù)的多樣性也挑戰(zhàn)著評(píng)測(cè)框架的靈活性,例如,選擇題和問答題往往需要不同的prompt和評(píng)估指標(biāo),如何快速對(duì)比few shot和zero shot的差異。因此,需要搭建方便快捷的網(wǎng)絡(luò)安全大模型評(píng)測(cè)框架,以支持不同模型、不同數(shù)據(jù)、不同評(píng)測(cè)指標(biāo)的靈活接入、快速評(píng)測(cè)。
三是輸出全面、清晰的評(píng)測(cè)結(jié)果。網(wǎng)絡(luò)安全大模型研發(fā)的不同階段其實(shí)對(duì)評(píng)測(cè)的需求不同。例如,在研發(fā)初期進(jìn)行基座模型選型階段,通常只需要了解各類基座模型的能力排名、對(duì)比不同模型能力差異;而在網(wǎng)絡(luò)安全大模型研發(fā)階段,就需要了解每次迭代模型能力的變化,仔細(xì)分析評(píng)估結(jié)果等。因此,網(wǎng)絡(luò)大模型評(píng)測(cè)需要輸出全面、清晰的評(píng)測(cè)結(jié)果,如評(píng)測(cè)榜單、能力對(duì)比、中間結(jié)果等,以支持不同研發(fā)階段的需求。
SecBench除了圍繞上述三個(gè)目標(biāo)進(jìn)行建設(shè)外,還設(shè)計(jì)了兩個(gè)網(wǎng)絡(luò)安全特色能力:安全領(lǐng)域評(píng)測(cè)和安全證書考試評(píng)估。安全領(lǐng)域評(píng)測(cè)從垂類安全視角,評(píng)測(cè)大模型在九個(gè)安全領(lǐng)域的能力;安全證書考試評(píng)估支持經(jīng)典證書考試評(píng)估,評(píng)測(cè)大模型通過安全證書考試的能力。
SecBench評(píng)測(cè)框架
SecBench網(wǎng)絡(luò)安全評(píng)測(cè)框架可以分為數(shù)據(jù)接入、模型接入、模型評(píng)測(cè)、結(jié)果輸出四個(gè)部分,通過配置文件配置數(shù)據(jù)源、評(píng)測(cè)模型、評(píng)估指標(biāo),即可快速輸出模型評(píng)測(cè)結(jié)果。- 數(shù)據(jù)接入:在數(shù)據(jù)接入上,SecBench支持多類型數(shù)據(jù)接入,如選擇題、判斷題、問答題等,同時(shí)支持自定義數(shù)據(jù)接入及評(píng)測(cè)prompt模板定制化。
- 模型接入:在模型接入上,SecBench同時(shí)支持HuggingFace開源模型、大模型API服務(wù)、本地部署大模型自由接入,還支持用戶自定義模型。
- 模型評(píng)測(cè):在模型評(píng)測(cè)上,SecBench支持多任務(wù)并行,加快評(píng)測(cè)速度。此外,SecBench已內(nèi)置多個(gè)評(píng)估指標(biāo)以支持常規(guī)任務(wù)結(jié)果評(píng)估,也支持自定義評(píng)估指標(biāo)滿足特殊需求。
- 結(jié)果輸出:在結(jié)果輸出上,SecBench不僅可以將評(píng)測(cè)結(jié)果進(jìn)行前端頁面展示,還可以輸出模型評(píng)測(cè)中間結(jié)果,如配置文件、輸入輸出、評(píng)測(cè)結(jié)果文件等,支持網(wǎng)絡(luò)安全大模型研發(fā)人員數(shù)據(jù)分析需求。

圖 4. SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)框架
SecBench評(píng)測(cè)數(shù)據(jù)
網(wǎng)絡(luò)安全大模型的能力難以評(píng)測(cè),主要原因之一還是網(wǎng)絡(luò)安全垂類數(shù)據(jù)的缺失。為了解決這一問題,SecBench目前已經(jīng)收集整理了12個(gè)安全評(píng)測(cè)數(shù)據(jù)集,累計(jì)數(shù)據(jù)10000余條。- 語言維度:覆蓋中文、英文兩類常見語言的評(píng)測(cè)。
- 能力維度:從安全視角,支持大模型對(duì)安全知識(shí)的知識(shí)記憶能力、邏輯推理能力、理解表達(dá)能力的評(píng)估。
- 領(lǐng)域維度:支持大模型在不同安全領(lǐng)域能力的評(píng)測(cè),包括數(shù)據(jù)安全、應(yīng)用安全、端點(diǎn)與主機(jī)安全、網(wǎng)絡(luò)與基礎(chǔ)架構(gòu)安全、身份與訪問控制、基礎(chǔ)軟硬件與技術(shù)、安全管理等。
- 證書考試:SecBench還積累了各類安全證書模擬試題,可支持大模型安全證書等級(jí)考試評(píng)估。

圖 5. SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)數(shù)據(jù)分布
當(dāng)前SecBench評(píng)測(cè)數(shù)據(jù)仍然存在多樣性不足、分布不均勻等問題,當(dāng)前正在持續(xù)補(bǔ)充建設(shè)多題型、多能力、多維度的評(píng)測(cè)數(shù)據(jù)。
SecBench評(píng)測(cè)結(jié)果
SecBench正在逐步接入大模型進(jìn)行網(wǎng)絡(luò)安全能力評(píng)測(cè),目前主要針對(duì)經(jīng)典GPT模型以及小規(guī)模開源模型進(jìn)行評(píng)測(cè)榜單輸出。展示模型在能力、語言、安全領(lǐng)域不同能力維度的結(jié)果,同時(shí)支持安全等級(jí)證書考試結(jié)果輸出。后續(xù)將持續(xù)接入商用大模型、安全大模型,支持模型能力對(duì)比等能力。
圖 6. SecBench網(wǎng)絡(luò)安全大模型評(píng)測(cè)榜單
隨著大模型在網(wǎng)絡(luò)安全領(lǐng)域的落地應(yīng)用加速,網(wǎng)絡(luò)安全大模型的評(píng)測(cè)變得尤為關(guān)鍵。SecBecnch已初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評(píng)測(cè)能力,以更好地支持網(wǎng)絡(luò)安全大模型的研發(fā)及落地應(yīng)用。此外為評(píng)估大模型在Prompt安全方面的表現(xiàn),騰訊朱雀實(shí)驗(yàn)室已聯(lián)合清華大學(xué)深圳國際研究生院,發(fā)布了《大語言模型(LLM) 安全性測(cè)評(píng)基準(zhǔn)》。
未來展望
SecBecnch初步建立起圍繞網(wǎng)絡(luò)安全垂類領(lǐng)域的評(píng)測(cè)能力,然而還有許多需要優(yōu)化迭代的地方:一是仍需持續(xù)補(bǔ)充構(gòu)建高質(zhì)量的網(wǎng)絡(luò)安全評(píng)測(cè)數(shù)據(jù),覆蓋多領(lǐng)域、多題型,以更好地支持模型在網(wǎng)絡(luò)安全領(lǐng)域的全面評(píng)測(cè);二是快速跟進(jìn)大模型評(píng)測(cè),對(duì)于新發(fā)布的大模型,能夠及時(shí)輸出評(píng)測(cè)結(jié)果;三是豐富模型結(jié)果呈現(xiàn)方式,支持模型對(duì)比、結(jié)果分析等功能,以滿足不同用戶的使用需求。SecBench也希望能夠引入更多的合作伙伴,包括學(xué)術(shù)界、工業(yè)界相關(guān)從業(yè)者,共創(chuàng)共贏,共同推動(dòng)網(wǎng)絡(luò)安全大模型的發(fā)展。
詳情請(qǐng)關(guān)注安在新媒體,一家信息安全領(lǐng)域媒體,以“做有內(nèi)涵的泛黑客媒體”為方向,線上通過自媒體,采訪網(wǎng)絡(luò)安全領(lǐng)域人物梳理行業(yè)脈絡(luò),通過介紹他們的經(jīng)歷、感悟、對(duì)行業(yè)的看法等來剖析網(wǎng)絡(luò)安全發(fā)展的脈絡(luò);致力于建立完整的信息發(fā)布矩陣,覆蓋微信、微博、知乎等主流自媒體渠道。
官網(wǎng):http://anzerclub.com/
市場(chǎng)部聯(lián)系(廠商):徐倩(微信:Madeline_Sue)
市場(chǎng)部聯(lián)系(甲方):Tina(微信:xuqingqing823125689 )及 Enco(微信:Anzer10)