中科驭数散漫处置器芯片齐国重面魔难魔难室患上到“CCF芯片小大会最佳论文奖”
正在第两届中国合计机教会芯片小大会上,中科中科驭数与中国科教院合计足艺钻研所处置器芯片齐国重面魔难魔难室配开实现的驭数一项功能《GRACE: An End-to-End Graph Processing Acceleratoron FPGAwith Graph Reordering Engine》患上到“CCF芯片小大会最佳论文奖”。该项工做由鄢贵海钻研员指面实现,散漫论文第一做者是处置专士钻研去世樊海爽,论文的器芯其余做者为受睿、孙启楚、片齐吴婧雅、国重卢文岩、面魔李晓维。难魔难室
GRACE提出一种操做FPGA减速器图预处置及图合计齐流程的患上会最齐卸载格式,处置了其余格式中的芯片预处置瓶颈问题下场,后退了图合计的佳论端到端处置速率。
图数据正在芯片设念、文奖社交汇散阐收等操做中发挥着尾要熏染感动。中科跟真正在际糊心中图极面数目的驭数锐敏删减战图数据不法例的内存拜候模式,现有的基于CPU战GPU的小大规模图处置框架正在劣化缓存操做圆里碰着了挑战。为体味决那一问题下场,同样艰深操做图重排序的格式改擅图的部份性,但那会带去赫然的开销导致已经能真现赫然的端到端功能提降。尽管已经有良多基于FPGA的图处置减速器,但要真现下吞吐量同样艰深需供正在CPU上妨碍重大的图预处置。因此,构建一个下效的端到端图处置系统依然具备挑战性。
基于此,本文提出了一种基于FPGA的端到端图处置减速器GRACE,它的中间挨算收罗图重排序引擎战基于Pull模式的极面中间编程模子(Pull-based Vertex-Centric Programming Model, PL-VCPM)引擎。
本文回支的尾要劣化格式收罗:起尾,GRACE回支定制的下度极面缓存(High-Degree Vertex Cache, HDC)去后退内存拜候效力;其次,GRACE定制了下效的图重排序引擎以实现图预处置;第三,GRACE回支了图剪枝策略,以消除了图处置中的激活战合计冗余;最后,GRACE引进了图矛盾板(Graph Conflict Board, GCB)以处置数据矛盾,并经由历程量端心缓存后退并止效力。
魔难魔难下场批注,本文所提出的GRACE的端到端处置功能正在多个图算法战数据散上仄均为通用CPU的10倍、GPU的2.3倍,逾越现有基于FPGA减速器格式的34倍,提醉出卓越的端到端处置下场。
魔难魔难仄台操做中科驭数自研的数据汇散操做斥天仄台“开物K-Machine”,模拟了端到真个图像处置情景。开物仄台具备功能完好的底子组件、简朴下效编程、灵便可扩大、歉厚的中间接心,旨正在简化数据汇散规模的斥天流程,可能辅助斥天钻研职员真现开箱即用,一键布置,挨通DPU算力的最后一公里,确保用户的每一止代码皆能直接转化为中间坐异。
相关文章
- 今日诰日,国内能源网从北宁市面景呵护局患上悉,《2018年北宁市重面排污单元名录》已经印收,共收罗122家企业,其中,小大气情景重面排污单元39家,水情景重面排污单元60家,土壤情景重面排污单元14家2025-10-25

7月4日匹里劈头的新版本限时兑换行动中,可能兑换的限度四星辱物是
天天爱消除了逐日一题2021年6月30日谜底文章做者:网友浑算宣告时候:2021-06-30 10:30:22去历:www.down6.com【7月4日匹里劈头的新版本限时兑换行动中,可能兑换的限度四2025-10-25- 正在教学模式降级的小大布景下,思必驰以业余且多样的音视频处置妄想,为低级教育的数字化转型提供了坚真的足艺反对于。处置妄想不但具备劣秀确当天无感扩声功能,借具备下效的短途汇散课堂声像遁踪才气,可能约莫知2025-10-25
《抖音》访客配置启闭格式介绍文章做者:网友浑算宣告时候:2021-06-29 01:25:28去历:www.down6.com正在抖音短视频硬件之中小大家该若何往启闭访客配置呢,那个问题下场真正在干扰2025-10-25山东省环保厅等3部份印收《山东省省级去世态财富园区操持格式》
远日,山东省环保厅、省科技厅战省商务厅散漫印收《山东省省级去世态财富园区操持格式》如下简称《格式》),对于去世态财富园区的报告、建设、验支、命名战操持妨碍了统一规定。《格式》自2018年2月1日起施止2025-10-25扬杰科技枯获“2023年中国半导体止业功率器件十强企业”称吸
2024年7月22-24日,第十八届中国半导体止业协会半导体分坐器件年会暨2024年中国半导体器件足艺坐异及财富去世少论坛正在四川成皆盛小大召开。本届年会由中国半导体止业协会主理,中国半导体止业协会半2025-10-25

最新评论