欢迎您访问新疆栾骏商贸有限公司,公司主营电子五金轴承产品批发业务!
全国咨询热线: 400-8878-609

新闻资讯

技术学院

C++如何实现一个简单的垃圾回收器_C++标记-清除(Mark-Sweep)垃圾回收算法原理

作者:穿越時空2025-12-02 00:00:00
标记-清除算法通过标记阶段从根对象出发标记所有可达对象,清除阶段回收未标记对象;C++中可模拟实现:定义GCObject基类、维护全局对象集与根集,重写markChildren遍历引用,执行mark-sweep流程回收不可达对象,示例中unreachable因无引用被释放,最终对象数减一。

在C++中实现一个简单的垃圾回收器,可以通过手动模拟“标记-清除”(Mark-Sweep)算法来管理动态分配的对象。虽然C++本身不提供自动垃圾回收机制,但我们可以利用智能指针、对象图遍历和内存标记技术来实现基础版本。

什么是标记-清除(Mark-Sweep)算法?

标记-清除算法是最早的垃圾回收策略之一,分为两个阶段:

  • 标记阶段:从根对象(如全局变量、栈上指针)出发,遍历所有可达对象,并给它们打上“存活”标记。
  • 清除阶段:扫描整个堆内存,回收未被标记的对象,释放其内存,并清除已标记对象的标记位以便下次使用。

该算法适用于存在复杂引用关系的对象系统,比如树形结构或图结构。

C++中如何模拟垃圾回收?

由于C++没有运行时类型信息(RTTI)支持完整的对象图遍历,我们需要对可被回收的对象进行封装,并显式维护引用关系。

以下是一个简化的实现思路:

  • 定义一个基类 GCObject,所有可被回收的对象都继承它。
  • 用一个全局集合记录所有已分配的 GCObject*
  • 每个对象包含一个标记位(mark bit)。
  • 提供根集(root set),例如当前活动的指针列表。
  • 实现 mark 阶段:从根开始递归标记所有可达对象。
  • 实现 sweep 阶段:遍历所有对象,删除未标记的。

代码示例:简易 Mark-Sweep GC

下面是一个极简版本的实现框架:

#include 
#include 
#include 
#include 

class GCObject { public: bool marked; GCObject() : marked(false) {} virtual ~GCObject() = default; virtual void markChildren() {} // 子类重写以标记引用的子对象 };

// 全局对象池和根集 std::set> all_objects; std::vector> roots;

void gc_mark() { for (auto* obj : roots) { if (obj && !obj->marked) { obj->marked = true; obj->markChildren(); } } }

void gc_sweep() { auto it = all_objects.begin(); while (it != all_objects.end()) { GCObject obj = it; if (!obj->marked) { it = all_objects.erase(it); delete obj; // 实际回收 } else { obj->marked = false; // 重置标记供下次使用 ++it; } } }

void garbage_collect() { std::cout << "开始垃圾回收...\n"; gc_mark(); gc_sweep(); std::cout << "垃圾回收完成。\n"; }

// 示例:一个持有其他对象引用的类 class ListObject : public GCObject { public: std::vector elements;

void markChildren() override {
    for (auto* elem : elements) {
        if (elem && !elem->marked) {
            elem->marked = true;
            elem->markChildren();
        }
    }
}

void add(GCObject* obj) {
    elements.push_back(obj);
}

};

// 辅助函数:注册新对象 template T new_object() { T obj = new T(); all_objects.insert(obj); return obj; }

// 添加根指针 void push_root(GCObject* obj) { roots.push_back(obj); }

void pop_root() { if (!roots.empty()) roots.pop_back(); }

使用示例

演示一次简单的垃圾回收过程:

int main() {
    // 创建一些对象并加入根
    ListObject* root_list = new_object();
    push_root(root_list);
// 添加子对象
GCObject* child1 = new_object();
GCObject* child2 = new_object();

root_list->add(child1);
root_list->add(child2);

// 再创建一个不可达对象
GCObject* unreachable = new_object();

std::cout << "总对象数: " << all_objects.size() << "\n";

// 执行GC
garbage_collect();

std::cout << "GC后剩余对象数: " << all_objects.size() << "\n";

// 清理根
pop_root();
return 0;

}

输出大致为:

总对象数: 4
开始垃圾回收...
垃圾回收完成。
GC后剩余对象数: 3

其中 unreachable 没有被任何根或子对象引用,因此被回收。

注意事项与局限性

  • 需要手动管理根集:程序员必须确保活跃指针正确添加到根中。
  • 无法处理循环引用以外的问题:本方案仍依赖开发者正确实现 markChildren
  • 性能开销:每次GC需遍历全部对象,不适合高频调用。
  • 缺乏类型安全和自动发现引用:C++没有反射机制,无法自动识别成员中的指针。

若要更进一步,可以结合 std::shared_ptr + std::weak_ptr 来避免循环引用,但这属于半自动方式,不是真正意义上的GC。

总结

尽管C++不内置垃圾回收,但通过继承统一基类、维护对象池和根集,可以实现一个基本的标记-清除回收器。这种技术适合嵌入式脚本引擎、游戏逻辑系统等需要可控内存管理的场景。关键是理解“可达性”概念,并在合适时机触发回收。

基本上就这些,不复杂但容易忽略细节。