數(shù)據(jù)中心最新文章

一種用于核與粒子物理實(shí)驗(yàn)數(shù)字化的多重?cái)?shù)觸發(fā)判選電路設(shè)計(jì)

核與粒子物理實(shí)驗(yàn)中,因?qū)嶒?yàn)本底與探測(cè)器噪聲影響,實(shí)驗(yàn)需要通過(guò)觸發(fā)判選機(jī)制篩選出有效物理事例,剔除掉本底噪聲。針對(duì)物理實(shí)驗(yàn)高事例率情況下基于擊中多重?cái)?shù)(Hit multiplicity,NHit)的觸發(fā)判選需求,設(shè)計(jì)了一種高性能數(shù)字觸發(fā)判選電路。該電路具有13路高速串行通信接口,支持光纖數(shù)據(jù)傳輸與千兆網(wǎng)絡(luò)通信;板載32 Gb DDR4緩存與高性能FPGA,以支持大容量高速存儲(chǔ)與實(shí)時(shí)數(shù)據(jù)處理?;谠撾娐房蛇\(yùn)行實(shí)時(shí)的硬件NHit觸發(fā)算法,從而實(shí)現(xiàn)對(duì)前端數(shù)據(jù)的快速觸發(fā)判選與數(shù)據(jù)讀出,同時(shí)該電路便于擴(kuò)展,可靈活地用在不同的物理實(shí)驗(yàn)上。經(jīng)過(guò)測(cè)試驗(yàn)證,數(shù)字觸發(fā)判選電路單路光纖接口傳輸速率可達(dá)8.125 Gb/s,上行網(wǎng)絡(luò)傳輸速率達(dá)949.3 Gb/s,DDR4緩存實(shí)際讀寫速率可達(dá)102.6 Gb/s,滿足數(shù)字觸發(fā)判選電路設(shè)計(jì)的數(shù)據(jù)傳輸與緩存需求。

發(fā)表于:1/16/2023

基于BERT-CNN的新聞文本分類的知識(shí)蒸餾方法研究

近年來(lái),隨著大數(shù)據(jù)時(shí)代進(jìn)入人類的生活之后,人們的生活中出現(xiàn)很多無(wú)法識(shí)別的文本、語(yǔ)義等其他數(shù)據(jù),這些數(shù)據(jù)的量十分龐大,語(yǔ)義也錯(cuò)綜復(fù)雜,這使得分類任務(wù)更加困難。如何讓計(jì)算機(jī)對(duì)這些信息進(jìn)行準(zhǔn)確的分類,已成為當(dāng)前研究的重要任務(wù)。在此過(guò)程中,中文新聞文本分類成為這個(gè)領(lǐng)域的一個(gè)分支,這對(duì)國(guó)家輿論的控制、用戶日常行為了解、用戶未來(lái)言行的預(yù)判都有著至關(guān)重要的作用。針對(duì)新聞文本分類模型參數(shù)量多和訓(xùn)練時(shí)間過(guò)長(zhǎng)的不足,在最大限度保留模型性能的情況下壓縮訓(xùn)練時(shí)間,力求二者折中,故提出基于BERT-CNN的知識(shí)蒸餾。根據(jù)模型壓縮的技術(shù)特點(diǎn),將BERT作為教師模型,CNN作為學(xué)生模型,先將BERT進(jìn)行預(yù)訓(xùn)練后再讓學(xué)生模型泛化教師模型的能力。實(shí)驗(yàn)結(jié)果表明,在模型性能損失約2.09%的情況下,模型參數(shù)量壓縮約為原來(lái)的1/82,且時(shí)間縮短約為原來(lái)的1/670。

發(fā)表于:1/13/2023