C# 托管代码和垃圾回收


什么是托管代码
托管代码就是执行过程交由运行时管理的代码。运行时一般是指 CLR,公共语言运行时。
CLR 负责提取托管代码、将其编译成机器代码,然后执行它。除此之外,运行时还负责自动内存管理、安全边界、类型安全等等。
如果在 .Net 里面直接调用 C/C++ 程序,此类代码也称为“非托管代码”。在非托管代码的环境中,操作系统将程序加载进内存,然后调用内部的二进制代码,所以从内存管理到安全等诸多因素都需要程序员自己处理。
正常使用 .Net 编写的代码,会先编译成中间语言 (IL)。执行的时候,CLR 会接管编译后的 IL,然后通过实时编译(JIT)将 IL 编译成可以在CPU上执行的机器码。这样 CLR 就能知道代码的确切作用,并管理代码。
分配内存
初始化新进程时,运行时会为进程创建托管堆。
托管堆是一个连续的地址空间区域,托管堆内维护着一个指针,用它指向将在堆中分配的下一个对象的地址。最初的时候,该指针指向托管堆的基址。
当应用程序创建第一个引用类型时,将为托管堆的基址中的类型分配内存。 应用程序创建下一个对象时,垃圾回收器在紧接第一个对象后面的地址空间内为它分配内存。 只要地址空间可用,垃圾回收器就会继续以这种方式为新对象分配空间。
严格来说,必须在托管堆上分配所有非 null 引用类型对象和所有装箱值类型对象。
从托管堆中分配内存要比非托管内存分配速度快。 由于运行时通过为指针添加值来为对象分配内存,所以这几乎和从堆栈中分配内存一样快。 另外,由于连续分配的新对象在托管堆中是连续存储,所以应用程序可以快速访问这些对象。
释放内存
垃圾回收器的优化引擎根据所执行的分配决定执行回收的最佳时间。
每个应用程序都有一组根。每个根或者指向托管堆中的对象,或者为空。 应用程序的根包含线程堆栈上的静态字段、局部变量和参数以及 CPU 寄存器。
垃圾回收器可以访问由实时 (JIT) 编译器和运行时维护的活动根的列表。垃圾回收器对照此根列表检查应用程序的根,并在此过程中创建一个图表,在其中包含所有可从这些根中访问的对象。
如果有一个对象,不在上面创建的图表中,那意味着这个对象将无法从应用程序的根中访问。这个时候,垃圾回收器就可以考虑释放为它们分配的内存。
回收的时候,垃圾回收器会检查托管堆,查找无法访问的对象所占据的地址块。当发现无法访问的对象的时候,GC 会通过内存复制的方法来压缩内存中可以访问的对象,并释放分配给不可访问对象的地址空间块。在压缩可访问的对象之后,GC 会更正原来指向这个对象的指针,使应用程序的根指向新地址中的对象。在 GC 完成之后,会将托管堆指针指向最后一个可访问的对象。
只有在发现了大量无法访问的对象的时候,才会压缩内存。
托管堆的级别和性能
为了提高 GC 的性能,托管堆被划分为3代:第0代、第1代和第2代。
划分不同代的依据:
- 压缩托管堆的一部分内存比压缩整个托管堆速度快
- 较新的对象生存期较短,较旧的对象生存期较长
- 较新的对象趋向于互相关联,并且大致同时由应用程序访问
新创建的对象储存在第0代。在第0代满了的时候,GC 会执行回收,尝试释放第0代中的地址空间。在第0代的回收执行之后,GC 会将第0代的内存对象升级到第1代。
如果第0代托管堆的回收没有回收足够的内存,不能使应用程序成功完成创建新对象的尝试,垃圾回收器就会先执行第1代托管堆的回收,然后再执行第2代托管堆的回收。如果这样仍不能回收足够的内存,垃圾回收器将执行第2、1 和 0 代托管堆的回收。
每次回收后,垃圾回收器都会压缩第0代托管堆中的可访问对象并将它们升级至第1代托管堆。 第1代托管堆中未被回收的对象将会升级至第2代托管堆。 由于垃圾回收器只支持三个级别,因此第2代托管堆中未被回收的对象会继续保留在第2代托管堆中,直到在将来的回收中确定它们为无法访问为止。
如果新创建的对象是大型对象,它们将延续到大型对象堆 (LOH),这有时称为第 3 代。 第 3 代是在第 2 代中逻辑收集的物理生成。
非托管资源的内存释放
非托管资源需要显式清除。
最常用的非托管资源类型是包装操作系统资源的对象(例如文件句柄、窗口句柄或网络连接)。GC 可以跟踪封装非托管资源的托管对象的生存期,但却无法具体了解如何清理资源。
创建封装非托管资源的对象时,建议在公共 Dispose 方法中提供必要的代码以清理非托管资源。 通过提供 Dispose 方法,对象的用户可以在使用完对象后显式释放其内存。 使用封装非托管资源的对象时,应该了解 Dispose 并在必要时调用它。
还必须提供一种释放非托管资源的方法,以防类型使用者忘记调用 Dispose。 可以使用安全句柄来包装非托管资源,也可以重写 Object.Finalize() 方法。
内存的基本知识
- 每个进程都有其单独的虚拟地址空间
- 同一台计算机上的所有进程共享相同的物理内存和页文件(如果有)
- 默认情况下,32位计算机上的每个进程都具有 2 GB的用户模式虚拟地址空间
- 程序开发人员,默认只能使用虚拟地址空间。GC 会为你分配和释放托管堆上的虚拟内存
- 虚拟内存的三种状态:
- Free:该内存块没有引用关系,可用于分配
- Reserved:给你用,其他人不能用。但是在提交之前,无法存储数据
- Committed:内存块已指派给物理存储
- 如果没有足够的可供保留的虚拟地址空间或可供提交的物理空间,则可能会用尽内存
- 托管堆可以看做大对象推和小对象堆的集合
- 大对象堆包含大小不小于 85,000 个字节的对象,这些对象通常是数组。 非常大的实例对象是很少见的。(可以配置阈值大小)
即使在物理内存压力(即物理内存的需求)较低的情况下也会使用页文件。 首次出现物理内存压力较高的情况时,操作系统必须在物理内存中腾出空间来存储数据,并将物理内存中的部分数据备份到页文件中。 该数据只会在需要时进行分页,所以在物理内存压力较低的情况下也可能会进行分页。
垃圾回收的过程
垃圾回收分为以下几个阶段:
- 标记阶段:找到并创建所有活动对象的列表。
- 重定位阶段:用于更新对将要压缩的对象的引用。
- 压缩阶段:用于回收由死对象占用的空间,并压缩幸存的对象。 压缩阶段将垃圾回收中幸存下来的对象移至段中时间较早的一端。
因为第 2 代回收可以占用多个段,所以可以将已提升到第 2 代中的对象移动到时间较早的段中。 可以将第 1 代幸存者和第 2 代幸存者都移动到不同的段,因为它们已被提升到第 2 代。
通常,由于复制大型对象会造成性能代偿,因此不会压缩大型对象堆 (LOH)。 但是,在 .NET Core 和 .NET Framework 4.5.1 及更高版本中,可以根据需要使用 GCSettings.LargeObjectHeapCompactionMode 属性按需压缩大型对象堆。
确定活动对象
垃圾回收器使用以下信息来确定对象是否为活动对象:
- 堆栈根。 由实时 (JIT) 编译器和堆栈查看器提供的堆栈变量。 JIT 优化可以延长或缩短报告给垃圾回收器的堆栈变量内的代码的区域。
- 垃圾回收句柄。 指向托管对象且可由用户代码或公共语言运行时分配的句柄。
- 静态数据。 应用程序域中可能引用其他对象的静态对象。 每个应用程序域都会跟踪其静态对象。
挂起
在垃圾回收启动之前,除了触发垃圾回收的线程以外的所有托管线程均会挂起。
//todo 内存虚拟地址和物理地址的转换过程
Subscribe to my newsletter
Read articles from 夜归人 directly inside your inbox. Subscribe to the newsletter, and don't miss out.
Written by

夜归人
夜归人
一个喜欢写代码的游戏玩家。 做了个原创的益智玩具(迷历),申请到了两个国家专利,玩过上百款游戏。 有个可爱的老婆,希望把日常的生活过成诗。