runloop在iOS开发中是一个十分基础的概念,本文将从CFRunLoop入手,介绍runloop的概念和底层实现原理。然后介绍Apple是如何通过runloop在处理一些列的触摸事件和方法回调以及自动释放池等功能的。文中部分内容来自此博客。
RunLoop的概念
一般来讲,一个线程一次只能执行一次任务,任务完成之后线程就会退出,但是如果一种这种机制,让一条线程既能处理事件又不退出,通常会设置一个无线的死循环,让这条线程在里面跑而不退出,一般的代码可以这样写:
1 | function loop() { |
上面这种模型我们通常称之为event loop。这种事件的处理模型在很多开发中都有,比如安卓开发中也有类似的loop循环,Windows的程序的循环消息,iOS/OSX的runloop等等。
所以runloop实际上也是一个对象,这个对象处理了很多东西,触摸事件和方法回调,并提供一个入口函数来执行event loop逻辑,线程执行完毕之后会一直处于“接收消息 - 等待 - 处理”的循环之中,直到这个循环结束,函数返回。
在iOS/OSX中提供了两种这样的对象:NSRunLoop和CFRunLoopRef。其中NSRunLoop是基于CFRunLoopRef的第二层封装,更加面向对象,但是NSRunLoop的API的线程是不安全的。
而CFRunLoopRef是在CoreFoundation的框架内的,它提供了纯C语言的API,所以这些API的线程是安全的。CFRunLoopRef 的代码是开源的,你可以在这里http://opensource.apple.com/tarballs/CF/下载到整个CoreFoundation 的源码来查看。
RunLoop与线程的关系
线程和RunLoop是一一对应的关系,每一条线程都有与之对应的RunLoop,主线程的RunLoop是在程序启动时就已经开启,而其他线程在被创建时并不会开启RunLoop,如果子线程不主动去开启RunLoop,那他将一直不会有。RunLoop的创建发生在第一次获取时,销毁时发生在线程结束时。只能在一条线程内部获取其RunLoop。
RunLoop对外的接口
在CoreFoundation框架中,提供了RunLoop的5种类:
- CFRunLoopRef
- CFRunLoopModeRef
- CFRunLoopSourceRef
- CFRunLoopTimerRef
CFRunLoopModeRef
其中,CFRunLoopModeRef并没有对外暴露接口,只是通过CFRunLoopRef对其接口进行封装,其关系如下:
一个RunLoop的包含若干个Mode,每个Mode又包含若干个source/timer/observer,每次调用RunLoop的主函数时,只能指定其中一个Mode,而这个Mode又被称之为currentMode。如果需要切换Mode只能退出当前的loop再重新指定一个Mode进入。这样做的目的是为了分隔开不同的source/timer/observer,让其相互之间互不影响。
CFRunLoopSourceRef
CFRunLoopSourceRef是事件产生的地方。source主要有2个版本:source0和source1,
- Source0 只包含了一个函数指针的回调,它并不能主动触发事件。使用时,你需要先调用CFRunLoopSourceSignal(source),将这个Source标记为待处理,然后手动调用CFRunLoopWakeUp(runloop)来唤醒RunLoop,让其处理这个事件。
- Source1 包含了 一个mach_port和一个函数的回调指针,被用于通过内核和其他线程相互发送消息。source1可以主动唤醒RunLoop的线程。
CFRunLoopTimerRef
CFRunLoopTimerRef是基于时间的触时发器,它和NSTimer可以混用。其中包含了一个时间的长度和一个函数的指针回调。当加入RunLoop时,RunLoop会注册对应的时间点,当时间点到时,RunLoop会被唤醒以执行此回调。
这里补充一个知识点,就是为什么NSTimer会不准的原因
首先我们知道,NSTimer是基于toll-free bridged的,严格来说NSTimer不是一个基于真实时间的机制,NSTimer被触发需要满足以下3个条件,
第一、NSTimer被添加到指定的RunLoop的Mode中;
第二、该Mode在RunLoop中正在运行;
第三、达到触发的时间,因为RunLoop需要管理大量的资源,为了提高NSTimer的效率,时间的间隔被限制为50-100毫秒比较合理,直到下一次RunLoop检测到NSTimer才会被触发
在苹果开发者文档中可以查看到,参考
即使NSTimer会基于时间发出通知,但是由于NSTimer不是一个基于真实时间的机制。和输入源一样,timer和指定Mode的RunLoop紧密相连。如果没有被当前的Mode的RunLoop监测到,timer就不会被触发,直到timer指定的Mode的RunLoop运行时才会被触发。类似的,当timer被触发的时间达到,而RunLoop却又恰好正在执行一个handler句柄,那么timer就不会被触发,而是等到下次的触发时间点通过RunLoop来唤醒timer执行回调操作。如果RunLoop不再运行,那么timer就永远不会被触发
CFRunLoopObserverRef
CFRunLoopObserverRef是RunLoop的观察者,每一个Observer都包含一个回调的函数指针,当RunLoop的状态发生变化时,观察者j就能通过回调接收到这个变化,在CFRunLoopRef的源码中,可以发现观察RunLoop的还时间点主要有以下几种:
1 | typedef CF_OPTIONS(CFOptionFlags, CFRunLoopActivity) { |
上面的Source/Timer/Observer被统称为Mode item,一个item可以同时加入多个Mode,但是一个item被重复加入同一个Mode将不会有效果。如果一个Mode中不包含其中任何一个item则RunLoop会直接退出,不再循环。
RunLoop的Mode
CFRunLoopMode和CFRunLoop的结构大致如下:
1 | struct __CFRunLoopMode { |
此处有个概念叫“CommonModes”:一个Mode可以将自己标记为“Common”属性(通过将它的ModeName添加到RunLoop的commonModes中)。每个RunLoop的内容发生变化时,RunLoop都会自动将_commonModeItems里的Source/Observer/Timer同步到具有common标记的Mode里。
例如:主线程的RunLoop里面有两个预置的Mode,即kCFRunLoopDefaultMode和UITrackingRunLoopMode。这两个Mode都已经被标记为common属性。defaultMode是APP平时所处的状态,TrackingRunLoopMode是已经追到ScrollView的滑动时的状态。当你创建一个Timer,并且添加到DefaultMode时,timer会得到重复的回调,但当此时滑动一个tableview或者scrollview时,RunLoop会将Mode切换为trackingRunLoopMode,此时这个timer将不会再被回调,并且也不会影响到滑动的操作。
所以,有时候你需要一个timer,在这两种Mode之间回调,一种办法就是将这个timer分别加入到这两种Mode。另外一种方式就是将这个timer加入到顶层的RunLoop的commonModeitems中。这个commonModeItems将会被更新到所有具有common的标记的属性的Mode中。
CFRunLoop对外暴露的接口只有以下2个:
1 | CFRunLoopAddCommonMode(CFRunLoopRef runloop, CFStringRef modeName); |
Mode 暴露的管理 mode item 的接口有下面几个:
1 | CFRunLoopAddSource(CFRunLoopRef rl, CFRunLoopSourceRef source, CFStringRef modeName); |
你只能通过 mode name 来操作内部的 mode,当你传入一个新的 mode name 但 RunLoop 内部没有对应 mode 时,RunLoop会自动帮你创建对应的 CFRunLoopModeRef。对于一个 RunLoop 来说,其内部的 mode 只能增加不能删除。
苹果公开提供的 Mode 有两个:kCFRunLoopDefaultMode (NSDefaultRunLoopMode) 和 UITrackingRunLoopMode,你可以用这两个 Mode Name 来操作其对应的 Mode。
同时苹果还提供了一个操作 Common 标记的字符串:kCFRunLoopCommonModes (NSRunLoopCommonModes),你可以用这个字符串来操作 Common Items,或标记一个 Mode 为 “Common”。使用时注意区分这个字符串和其他 mode name。
RunLoop 的内部逻辑
根据苹果在文档里的说明,RunLoop 内部的逻辑大致如下:
1 | /// 用DefaultMode启动 |
可以看到,实际上 RunLoop 就是这样一个函数,其内部是一个 do-while 循环。当你调用 CFRunLoopRun() 时,线程就会一直停留在这个循环里;直到超时或被手动停止,该函数才会返回。
RunLoop 的底层实现
从上面代码可以看到,RunLoop 的核心是基于 mach port 的,其进入休眠时调用的函数是 mach_msg()。为了解释这个逻辑,下面稍微介绍一下 OSX/iOS 的系统架构。
苹果官方将整个系统大致划分为上述4个层次:
应用层包括用户能接触到的图形应用,例如 Spotlight、Aqua、SpringBoard 等。
应用框架层即开发人员接触到的 Cocoa 等框架。
核心框架层包括各种核心框架、OpenGL 等内容。
Darwin 即操作系统的核心,包括系统内核、驱动、Shell 等内容,这一层是开源的,其所有源码都可以在opensource.apple.com里找到。
我们在深入看一下 Darwin 这个核心的架构:
其中,在硬件层上面的三个组成部分:Mach、BSD、IOKit (还包括一些上面没标注的内容),共同组成了 XNU 内核。
XNU 内核的内环被称作 Mach,其作为一个微内核,仅提供了诸如处理器调度、IPC (进程间通信)等非常少量的基础服务。
BSD 层可以看作围绕 Mach 层的一个外环,其提供了诸如进程管理、文件系统和网络等功能。
IOKit 层是为设备驱动提供了一个面向对象(C++)的一个框架。
Mach 本身提供的 API 非常有限,而且苹果也不鼓励使用 Mach 的 API,但是这些API非常基础,如果没有这些API的话,其他任何工作都无法实施。在 Mach 中,所有的东西都是通过自己的对象实现的,进程、线程和虚拟内存都被称为”对象”。和其他架构不同, Mach 的对象间不能直接调用,只能通过消息传递的方式实现对象间的通信。”消息”是 Mach 中最基础的概念,消息在两个端口 (port) 之间传递,这就是 Mach 的 IPC (进程间通信) 的核心。
Mach 的消息定义是在 <mach/message.h>头文件的,很简单:
1 | typedef struct { |
一条 Mach 消息实际上就是一个二进制数据包 (BLOB),其头部定义了当前端口 local_port 和目标端口 remote_port,发送和接受消息是通过同一个 API 进行的,其 option 标记了消息传递的方向:
1 | mach_msg_return_t mach_msg( |
为了实现消息的发送和接收,mach_msg() 函数实际上是调用了一个 Mach 陷阱 (trap),即函数mach_msg_trap(),陷阱这个概念在 Mach 中等同于系统调用。当你在用户态调用 mach_msg_trap() 时会触发陷阱机制,切换到内核态;内核态中内核实现的 mach_msg() 函数会完成实际的工作,
RunLoop 的核心就是一个 mach_msg() (见上面代码的第7步),RunLoop 调用这个函数去接收消息,如果没有别人发送 port 消息过来,内核会将线程置于等待状态。例如你在模拟器里跑起一个 iOS 的 App,然后在 App 静止时点击暂停,你会看到主线程调用栈是停留在 mach_msg_trap() 这个地方。
关于具体的如何利用 mach port 发送信息,可以看看NSHipster 这一篇文章,或者这里的中文翻译 。
关于Mach的历史可以看看这篇很有趣的文章:Mac OS X 背后的故事(三)Mach 之父 Avie Tevanian。
苹果用 RunLoop 实现的功能
首先我们可以看一下 App 启动后 RunLoop 的状态:
1 | CFRunLoop { |
可以看到,系统默认注册了5个Mode:
kCFRunLoopDefaultMode: App的默认 Mode,通常主线程是在这个 Mode 下运行的。
UITrackingRunLoopMode: 界面跟踪 Mode,用于 ScrollView 追踪触摸滑动,保证界面滑动时不受其他 Mode 影响。
UIInitializationRunLoopMode: 在刚启动 App 时第进入的第一个 Mode,启动完成后就不再使用。
4: GSEventReceiveRunLoopMode: 接受系统事件的内部 Mode,通常用不到。
5: kCFRunLoopCommonModes: 这是一个占位的 Mode,没有实际作用。
你可以在这里看到更多的苹果内部的 Mode,但那些 Mode 在开发中就很难遇到了。
当 RunLoop 进行回调时,一般都是通过一个很长的函数调用出去 (call out), 当你在你的代码中下断点调试时,通常能在调用栈上看到这些函数。下面是这几个函数的整理版本,如果你在调用栈中看到这些长函数名,在这里查找一下就能定位到具体的调用地点了:
1 | { |
AutoreleasePool
App启动后,苹果在主线程 RunLoop 里注册了两个 Observer,其回调都是 _wrapRunLoopWithAutoreleasePoolHandler()。
第一个 Observer 监视的事件是 Entry(即将进入Loop),其回调内会调用 _objc_autoreleasePoolPush() 创建自动释放池。其 order 是-2147483647,优先级最高,保证创建释放池发生在其他所有回调之前。
第二个 Observer 监视了两个事件: BeforeWaiting(准备进入休眠) 时调用_objc_autoreleasePoolPop() 和 _objc_autoreleasePoolPush() 释放旧的池并创建新池;Exit(即将退出Loop) 时调用 _objc_autoreleasePoolPop() 来释放自动释放池。这个 Observer 的 order 是 2147483647,优先级最低,保证其释放池子发生在其他所有回调之后。
在主线程执行的代码,通常是写在诸如事件回调、Timer回调内的。这些回调会被 RunLoop 创建好的 AutoreleasePool 环绕着,所以不会出现内存泄漏,开发者也不必显示创建 Pool 了。
事件响应
苹果注册了一个 Source1 (基于 mach port 的) 用来接收系统事件,其回调函数为 __IOHIDEventSystemClientQueueCallback()。
当一个硬件事件(触摸/锁屏/摇晃等)发生后,首先由 IOKit.framework 生成一个 IOHIDEvent 事件并由 SpringBoard 接收。这个过程的详细情况可以参考这里。SpringBoard 只接收按键(锁屏/静音等),触摸,加速,接近传感器等几种 Event,随后用 mach port 转发给需要的App进程。随后苹果注册的那个 Source1 就会触发回调,并调用 _UIApplicationHandleEventQueue() 进行应用内部的分发。
_UIApplicationHandleEventQueue() 会把 IOHIDEvent 处理并包装成 UIEvent 进行处理或分发,其中包括识别 UIGesture/处理屏幕旋转/发送给 UIWindow 等。通常事件比如 UIButton 点击、touchesBegin/Move/End/Cancel 事件都是在这个回调中完成的。
手势识别
当上面的 _UIApplicationHandleEventQueue() 识别了一个手势时,其首先会调用 Cancel 将当前的 touchesBegin/Move/End 系列回调打断。随后系统将对应的 UIGestureRecognizer 标记为待处理。
苹果注册了一个 Observer 监测 BeforeWaiting (Loop即将进入休眠) 事件,这个Observer的回调函数是 _UIGestureRecognizerUpdateObserver(),其内部会获取所有刚被标记为待处理的 GestureRecognizer,并执行GestureRecognizer的回调。
当有 UIGestureRecognizer 的变化(创建/销毁/状态改变)时,这个回调都会进行相应处理。
界面更新
当在操作 UI 时,比如改变了 Frame、更新了 UIView/CALayer 的层次时,或者手动调用了 UIView/CALayer 的 setNeedsLayout/setNeedsDisplay方法后,这个 UIView/CALayer 就被标记为待处理,并被提交到一个全局的容器去。
苹果注册了一个 Observer 监听 BeforeWaiting(即将进入休眠) 和 Exit (即将退出Loop) 事件,回调去执行一个很长的函数:
_ZN2CA11Transaction17observer_callbackEP19__CFRunLoopObservermPv()。这个函数里会遍历所有待处理的 UIView/CAlayer 以执行实际的绘制和调整,并更新 UI 界面。
这个函数内部的调用栈大概是这样的:
1 | _ZN2CA11Transaction17observer_callbackEP19__CFRunLoopObservermPv() |
定时器
NSTimer 其实就是 CFRunLoopTimerRef,他们之间是 toll-free bridged 的。一个 NSTimer 注册到 RunLoop 后,RunLoop 会为其重复的时间点注册好事件。例如 10:00, 10:10, 10:20 这几个时间点。RunLoop为了节省资源,并不会在非常准确的时间点回调这个Timer。Timer 有个属性叫做 Tolerance (宽容度),标示了当时间点到后,容许有多少最大误差。
如果某个时间点被错过了,例如执行了一个很长的任务,则那个时间点的回调也会跳过去,不会延后执行。就比如等公交,如果 10:10 时我忙着玩手机错过了那个点的公交,那我只能等 10:20 这一趟了。
CADisplayLink 是一个和屏幕刷新率一致的定时器(但实际实现原理更复杂,和 NSTimer 并不一样,其内部实际是操作了一个 Source)。如果在两次屏幕刷新之间执行了一个长任务,那其中就会有一帧被跳过去(和 NSTimer 相似),造成界面卡顿的感觉。在快速滑动TableView时,即使一帧的卡顿也会让用户有所察觉。Facebook 开源的 AsyncDisplayLink 就是为了解决界面卡顿的问题,其内部也用到了 RunLoop,这个稍后我会再单独写一页博客来分析。
PerformSelecter
当调用 NSObject 的 performSelecter:afterDelay: 后,实际上其内部会创建一个 Timer 并添加到当前线程的 RunLoop 中。所以如果当前线程没有 RunLoop,则这个方法会失效。
当调用 performSelector:onThread: 时,实际上其会创建一个 Timer 加到对应的线程去,同样的,如果对应线程没有 RunLoop 该方法也会失效。
GCD
实际上 RunLoop 底层也会用到 GCD 的东西,比如 RunLoop 是用 dispatch_source_t 实现的 Timer(评论中有人提醒,NSTimer 是用了 XNU 内核的 mk_timer,我也仔细调试了一下,发现 NSTimer 确实是由 mk_timer 驱动,而非 GCD 驱动的)。但同时 GCD 提供的某些接口也用到了 RunLoop, 例如 dispatch_async()。
当调用 dispatch_async(dispatch_get_main_queue(), block) 时,libDispatch 会向主线程的 RunLoop 发送消息,RunLoop会被唤醒,并从消息中取得这个 block,并在回调 __CFRUNLOOP_IS_SERVICING_THE_MAIN_DISPATCH_QUEUE__() 里执行这个 block。但这个逻辑仅限于 dispatch 到主线程,dispatch 到其他线程仍然是由 libDispatch 处理的。
网络请求
iOS 中,关于网络请求的接口自下至上有如下几层:
1 | CFSocket |
CFSocket 是最底层的接口,只负责 socket 通信。
- CFNetwork 是基于 CFSocket 等接口的上层封装,ASIHttpRequest 工作于这一层。
- NSURLConnection 是基于 CFNetwork 的更高层的封装,提供面向对象的接口,AFNetworking 工作于这一层。
- NSURLSession 是 iOS7 中新增的接口,表面上是和 NSURLConnection 并列的,但底层仍然用到了 NSURLConnection 的部分功能 (比如 com.apple.NSURLConnectionLoader 线程),AFNetworking2 和 Alamofire 工作于这一层。
下面主要介绍下 NSURLConnection 的工作过程。
通常使用 NSURLConnection 时,你会传入一个 Delegate,当调用了 [connection start] 后,这个 Delegate 就会不停收到事件回调。实际上,start 这个函数的内部会会获取 CurrentRunLoop,然后在其中的 DefaultMode 添加了4个 Source0 (即需要手动触发的Source)。CFMultiplexerSource 是负责各种 Delegate 回调的,CFHTTPCookieStorage 是处理各种 Cookie 的。
当开始网络传输时,我们可以看到 NSURLConnection 创建了两个新线程:com.apple.NSURLConnectionLoader 和 com.apple.CFSocket.private。其中 CFSocket 线程是处理底层 socket 连接的。NSURLConnectionLoader 这个线程内部会使用 RunLoop 来接收底层 socket 的事件,并通过之前添加的 Source0 通知到上层的 Delegate。
NSURLConnectionLoader 中的 RunLoop 通过一些基于 mach port 的 Source 接收来自底层 CFSocket 的通知。当收到通知后,其会在合适的时机向 CFMultiplexerSource 等 Source0 发送通知,同时唤醒 Delegate 线程的 RunLoop 来让其处理这些通知。CFMultiplexerSource 会在 Delegate 线程的 RunLoop 对 Delegate 执行实际的回调。