基于二级片内硬件堆栈的后向CFI 验证方法研究,第一章-程序员宅基地

技术标签: 安全  安全架构  基于二级片内硬件堆栈的后向CFI验证方法验证  硬件架构  perl  

随着计算机技术的发展,针对计算机系统的恶意攻击越来越多,造成了巨大的经济损失。面向返回导向编程等恶意攻击方式通过修改堆栈中程序返回地址劫持控制流,达到恶意攻击的目的。后向控制流完整性即返回地址的完整性验证,是一种保护函数返回地址的有效手段。
本文提出了一种基于二级硬件堆栈的后向程序控制流完整性验证方法,并在国产玄铁E906 RISC-V处理器中进行了实现和分析。基于现有针对返回地址的攻击方式和后向CFI的实现方法,建立了恶意攻击威胁模型,确定了设计的安全边界;设计了二级硬件堆栈结构,可通过专用片上硬件缓冲区自动暂存新入栈返回地址,并将缓存区中旧返回地址送入传统内存堆栈;提出了二级硬件堆栈的两种具体实现方法,即延迟验证和批处理验证,分别实现对内存堆栈中返回地址的细粒度逐个验证,和基于消息验证码的多返回地址的批处理验证;在国产玄铁E906 RISC-V处理器中分别实现了两种验证方法,采用公认的基准测试程序分别对两种实现进行功能仿真和FPGA验证,并针对不同缓冲区尺寸进行了安全性和系统开销分析。
实验结果表明,本文提出的二级片内硬件堆栈能够实现对后向程序控制流的监控和验证;在返回地址缓冲区大小为2个机器字时,延迟验证和批处理验证带来的性能开销分别不高于2.94%和4.20%;返回地址缓冲区大小为4时,延迟验证和批处理验证带来的性能开销均不高于0.72%;通过Xilinx Vivado工具评估延迟验证和批处理验证实现在返回地址缓冲区大小为4时分别带来了4.7%和4.1%的硬件资源开销。

交流 QQ 3270516346 WX wwwicer

第1章 绪论

1.1 课题的研究背景与意义

如今人们的日常生产生活已经离不开计算机,计算机被广泛应用到工业、国防、教育、经济、医疗等各个领域。然而,针对计算机系统的恶意攻击也数不胜数,攻击者利用计算机存在的漏洞实施攻击,进而控制计算机系统进行恶意操作,造成了巨大的损失。控制流劫持攻击就是一种常见的攻击方式,该攻击利用程序控制流存在的漏洞,篡改控制流数据或者函数指针、返回地址等,使程序转向预先设定的恶意代码进而完成各种任意恶意操作。其中面向返回编程攻击(Return-oriented programming,ROP)就是一种常见的攻击方式,它会改变函数的返回地址来劫持程序的控制流,实施恶意操作。为了保护返回地址,越来越多的防御措施被研究者提出,包括影子栈[1]、基于加密的控制流完整性(cryptog- raphic control flow integrity,CCFI)[2]、ARM指针认证[3]、链式堆栈等。CCFI和ARM指针认证等都是使用消息验证码(Message Authentication Code,MAC)来保护返回地址的完整性的,通过使用消息消息认证码机制使程序返回地址更加安全,提高了攻击者利用ROP等方式进行攻击的门槛。

然而,由于程序中返回地址调用和返回非常频繁,基于MAC的机制进行验证给计算机系统带来了巨大的性能开销,降低了计算机系统的实时性,人们迫切需要采取相应措施降低性能的开销。
RISC-V是一种开源的指令集架构[5],它的设计是基于精简指令计算机原则。RISC-V的设计是完全开放的,任何人都可以使用、研究、修改和分发它,RISC-V可以为不同的场景提供不同的配置,可以被广泛应用于各个领域。同时由于RISC-V架构具有更理想的功耗、性能和面积,全球各大厂商以及研究机构都开始研究和设计基于RISC-V架构的产品。因此,在未来基于RISC-V的计算机系统将会越来越流行。

本文提出了二级片内硬件堆栈的结构来加速和减少消息验证码的计算,从而提高系统性能。基于玄铁E906这款开源32位RISC-V微处理器,分别采用延迟验证和批处理验证两种实现方法部署二级硬件堆栈,在使用消息验证码方案保护返回地址时,显著降低了系统的性能开销,同时安全性也得到了一定的提高。

1.2 国内外研究现状

现有的计算机漏洞中,控制流劫持攻击是所有攻击中危害最严重的攻击之一。控制流完整性(Control-flow Integrity,CFI)能够有效的防护一些控制流劫持攻击,其中后向CFI主要是指子函数返回时保护程序返回地址的完整性,后向CFI可以有效的防护像ROP等多种攻击。研究人员提出了一些保护程序返回地址的策略,但都有较大的性能开销,研究人员也正在寻找能够在较低性能开销情况下保护返回地址的策略。

2005年,Abadi等人首次提出控制流完整性的概念[5],其核心思想是限制程序运行中的控制转移,使程序始终处于原有的控制流图所限定的范围内。其添加了运行时检查,在生成程序的控制流图以后,通过分析程序控制流图获得转移指令的白名单,在程序运行间接转移指令时检测转移的目标地址是否在白名单中,部署CFI能够有效防御控制流劫持攻击之类的攻击。但是CFI的不同实现安全性也不同,细粒度CFI的性能开销较大,粗粒度的CFI的执行限度较弱,安全性不够,在应用系统上,CFI还没有被广泛应用。

影子栈是保护程序返回地址的一种经典手段[1]。在函数调用时它将返回地址备份到专用且受保护的地址空间中,在子函数返回时它将堆栈中的返回地址与备份的返回地址进行比较,检查返回地址是否被篡改。SafeStack也是一种类似的方式[6],它将所有返回地址存放到一个独立的堆栈中,而不是备份返回地址。但是影子栈容易受到内存泄漏的攻击,并且严重依赖于内存的安全性。SafeStack实现需要进行内存隔离等消耗更多的内存,实现也比较复杂,并且也依赖于内存的安全性。

为了改进CFI,一些研究者还引入了加密的方法。2015年Ali Jose Mashtizadeh等人提出了基于MAC机制的加密控制流完整性(CCFI)[2],它使用MAC来保护控制流元素,如函数指针、返回地址和虚表指针,该机制计算返回地址、函数指针等的MAC并在返回之前验证他们。该机制不依赖于内存的安全性,因为攻击者在没有密钥的情况下不能生成正确的MAC,能够有效保护返回地址。在ARM发布的ARMv8.3-A架构中引入了指针身份认证[3],该机制在指针写入内存之前生成该指针的指针身份认证码,并在使用指针之前进行验证,想要修改受保护的指针攻击者必须能够找到正确的指针身份认证码才能控制返回地址,这使得攻击者很难在不被发现的情况下修改内存中受保护的指针。但是这种基于消息验证码的机制依赖于密钥的安全性,并且由于子程序调用频繁,MAC计算会带来巨大的性能开销。

通过消息验证码在一定程度上能够保护返回地址,但是程序调用返回地址频繁,带来了巨大的性能开销,在一些对于实时性等要求比较高的应用中难以部署。研究者也提出过一些降低系统性能开销的方法。

在Hans Liljestrand提出的验证调用堆栈中[7],使用链式消息验证码,将消息验证码保存在返回地址的高位,并且使用纯软件实现方案,不需要修改硬件结构。但是该设计无法在32位或更低位数的处理器中部署,采用软件实现指令数增加,也带来一定的性能开销。

2020年陈立伟等人提出了链式认证栈[4],这是一种改进的基于消息认证码的返回地址验证方案。链式认证栈在开源RISC-V五级流水线处理器Rocket中实现时,将消息验证码的计算同处理器的流水线并行处理,所以只要在下一次计算消息验证码之前,当前的消息验证码计算完成,流水线就不会停止。除此之外,在设计中还添加一个缓存保存最近计算的消息验证码,在计算时如果能在缓存中找到相应的结果就不需要在计算,这也在一定程度上提高了系统的性能。但在此方案中仍然需要修改编译器添加指令,在子函数调用频繁的程序中仍然会使流水线暂停较长的时间,仍然有不小的系统开销并且实现复杂。

2018年张军等人提出了RAGuard[8],这也是一种基于MAC机制保护返回地址的策略。在该策略中使用了物理不可克隆函数和真随机数发生器作为密钥管理模块,提高了密钥的安全性。并且在该策略中使用硬件检测叶函数,使用专门的寄存器保存叶函数的返回地址而不需要加载和存储叶函数的MAC,提高了基于MAC机制保存返回地址的性能,但是仍然也有一定程度的性能开销并且增加了硬件面积。

在李锦峰等人提出的错位堆栈中[9],该机制是一种专用的在基于MAC验证返回地址的系统中降低系统性能开销的方法。该方法在保存和调用返回地址指令之前添加一条指令用于计算消息认证码,在返回地址保存到存储器之前添加一个硬件单元。硬件单元保存最近的返回地址,只有当返回地址被推入存储器时才进行验证,由于大多数返回地址被存储后立刻调用,该机制减少了MAC验证的次数,大大提高了系统性能。但是该设计还没有支持Setjmp/Longjmpi,设计需要同时修改软硬件在具体的系统中实现较为复杂。

可见,基于MAC机制在一定程度上能够保护返回地址但都带来一定的性能开销,需要一定方法在保证返回地址安全的前提下降低系统的性能开销,但现有的降低系统性能方法的研究相对较少并且现有的方法实现比较复杂,我们需要一种实现相对简单并且能够显著降低性能开销的方案。我们设计的二级硬件堆栈能够显著降低基于MAC机制保护返回地址的系统的性能开销,并且在一定程度上也增强了对返回地址的保护。

1.3 本文主要研究内容

基于二级片内硬件堆栈的后向 CFI 研究,首先分析基于 MAC 机制对返回地址进行防护的一些原理和方法,然后设计指令检测单元以便获取返回地址,接着设计返回地址缓冲区以存放最近的函数返回地址,设计 MAC 生成单元并将各个模块集成,最后在 RISC-V 中运行相应测试程序以测试性能改进。研究内容主要包括:
(1)研究基于 MAC 机制保护函数返回地址的方法。在将返回地址保存到堆栈前计算返回地址的 MAC 码并保存,当子函数返回时,再次计算返回地址的 MAC 码并与之前的 MAC 对比,来验证返回地址有没有被修改。
(2)指令检测模块的设计与硬件实现。在 RISC-V 中有相应的将返回地址存储到堆栈和从堆栈中调用返回地址的指令,需要设计相应的硬件以便获取当前的返回地址并把之前的返回地址推入堆栈。
(3)返回地址缓冲区的设计。返回地址缓冲区存放最近的返回地址,主要设计包括缓冲区的大小、对缓冲器的控制以及对缓冲区的读写。
(4)二级堆栈的硬件开销与性能评估。将设计的二级堆栈集成到 RISC-V 中,运行相关测试程序对比处理器性能的改变。在 FPGA 平台上实现,评估设计所消耗的硬件资源。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。
本文链接:https://blog.csdn.net/weixin_48984764/article/details/137136850

智能推荐

linux loadavg详解(top cpu load)-程序员宅基地

文章浏览阅读241次。目录[隐藏]1Loadavg分析1.1Loadavg浅述1.2Loadavg读取1.3Loadavg和进程之间的关系1.4Loadavg采样218内核计算loadavg存在的问题2.1xtime_lock解析2.2全局load读写分离解xtime_lock问题2.3几个关键点:2..._$load_avg_per_cpu.max.warn

【数据结构初阶】八大排序(二)——快速排序&&冒泡排序-程序员宅基地

文章浏览阅读1.2k次,点赞53次,收藏39次。快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫快速排序时间复杂度:O(N*logN)空间复杂度:O(logN)稳定性:不稳定。

githubDesktop的使用说明(附下载链接)_下载了githubdesktop-程序员宅基地

文章浏览阅读1.3k次。step1 :下载百度云链接https://pan.baidu.com/s/1luAFF8gGddWFqgbq-_X0cg提取码: 5xdj包含 git github forwindows githubforMac 以及notepad++step2:安装这个安装程序,是强制安装路径的,所以不要乱搞 下载之后直接点击就行。@基本情况就是这样..._下载了githubdesktop

初探Java Nashorn脚本引擎-程序员宅基地

文章浏览阅读4.7k次。要想让一个程序功能变得灵活起来,那么配置绝对是不可或缺的,通过合理的设计,将所有动态变量都配置化,可以最大程度上让程序变得灵活。可是在某些复杂的业务场景中,仅仅只是变量的配置化,往往还并不能满足需求,尤其是互联网这种业务需要快速更迭的行业。于是,做一个这样的功能:仅仅依靠配置,就能让程序的逻辑cover住所有的业务逻辑变化,就成为了程序员的终极梦想。然而,现实是残酷的,"write once run forevre",这几乎是不可能实现的梦想(如果真的出现了这样的技术,那可能会是我们职业生涯将要面对的最_nashorn

【CTF】用python PIL将RGB值转化为图片_ctf 三个坐标值转换图像-程序员宅基地

文章浏览阅读1.5w次,点赞4次,收藏28次。一道关于ctf的题,用python将rgb值转化为图片_ctf 三个坐标值转换图像

海思HI35xx平台软件开发快速入门之背景知识-程序员宅基地

文章浏览阅读1.4k次。前言: 安防领域最近几年可谓暗流涌动,作为安防业的双寡头,大华股份与海康威视凭借行业的东风,两家公司的成长速度异常强劲,在国际市场上已经和应用厂家进行厮杀。 2015年两家公司双双晋升“全球安放50强”,海康排名第二,大华排名第五。以华为海思为代表国产芯片解决方案不断走强,在国际竞争中优势凸显,在后端NVR高端产品线先后推出了海思3531、海思3535、海思3536,同时针对低端的产品线也不..._海思hi35xx平台软件开发快速入门之背景知识

随便推点

mathtype插入在WPS中出现The MathType DLL cannot be found问题_mathtype不能被发现-程序员宅基地

文章浏览阅读2k次。mathtype插入在WPS中出现The MathType DLL cannot be found问题_mathtype不能被发现

Lc.exe已退出代码为-1问题解决⽅法_lc.exe已退出 代码为-1-程序员宅基地

文章浏览阅读1.8k次,点赞2次,收藏3次。对于⽤vs作为开发⼯具的同学来说,可能常常会碰到“Lc.exe已退出代码为-1”的问题,造成这个结果的⼀般是因为加⼊了第三⽅的插件程序造成的,今天记录下如何解决。查看加载的程序项⽬,找到Properties⽂件夹licenses.licx⽂件,然后右键选择删除就可以了,调试运⾏正常了。可以使⽤⽂本编辑器打开上述⽂件,也可以使⽤其它的编辑器,在⽂件中查找licenses.licx字样,删除对应节点。找到你系统的*.csproj⽂件,这个⽂件是加载项⽬⽂件。c.exe已退出代码为-1问题解决⽅法。_lc.exe已退出 代码为-1

linux系统忘记登录密码怎么办_linux忘记密码-程序员宅基地

文章浏览阅读6.4k次,点赞7次,收藏29次。【代码】linux系统忘记登录密码怎么办。_linux忘记密码

Allegro经典报错解决方案_program has encountered a-程序员宅基地

文章浏览阅读1.4w次,点赞5次,收藏12次。Allegro软件经典报错解决方案Allegro经典报错解决方案初学者在用cadence画pcb的时候,偶尔会遇到像这样的问题。“Program has encountered a problem and must exit The design will besaved as a SAV file that can be recovered using dbdoctor (íf applic..._program has encountered a

tomcat11、tomcat10 安装配置(Windows环境)(详细图文)-程序员宅基地

文章浏览阅读1.7w次,点赞11次,收藏102次。Tomcat11、Tomcat10安装(详细)一、检查Java在Windows上的存在。二、查看tomcat版本规范,确定适合自己机器的tomcat版本。三、tomcat下载。下载目录里的文件分类类型说明。四、tomcat10安装。五、tomcat10安装不成功时解决方案。六、启动tomcat时运行界面乱码的解决方法。七、tomcat 相关配置文章............_tomcat10

数据结构java版本 队列,链表,栈_javal链表 top还是front-程序员宅基地

文章浏览阅读134次。数据结构和算法的关系数据结构是一门研究组织数据方式的学科,程序=数据结构+算法数据结构是算法的基础数据结构结构:线性结构:数组,队列,链表,栈顺序存储结构链式存储结构非线性结构:二维数组,多维数组,广义表,树,图稀疏数组的概念当一个数组中大部分元素为0时,或者为同一个值的数组时,可以使用记录数组一共有几行几列,有多少个不同的数值把具有不同值的元素的行列及值记录在一个小规模的数组中,从而缩小程序的规模二维数组转为稀疏数组:遍历原始的二维数组,得到有效数据的个数sum_javal链表 top还是front