软中断网卡处理&Linux高性能外部设备处理机制&SMP

xuela_net

浏览: 494519 次

最近访客更多访客>>

u012363178

liexusong001

13931799482

bluesun_cn

博主相关

博客

微博

相册

留言

关于我

文章分类

全部博客 (1052)

社区版块

存档分类

2013-08 ( 5)
2013-07 ( 243)
2013-06 ( 185)
更多存档...

Jack：Linux外部设备的性能如何才能高呢？

我：你为什么希望外部设备的性能好呢？

Jack：典型的说，外部设备如磁盘、网卡都需要非常好的性能。磁盘设备处理性能好，才能承载数据库系统。网卡性能好，才能承载高性能server（数据库或者web server）。

我：那你觉得用什么样的方式处理这两个外部设备，它的性能会好呢？

Jack：外部设备要好，当然应该采用中断方式，这是性能最高的。

我：你错了。外部设备与CPU的交互方式，最快的是DMA。但是，DMA方式会使外部设备的控制器独占PCI总线，从而CPU无法与外部设备进行交互——这对通用型操作系统来说，是很难接受的。所以DMA方式，在Linux内核里使用得很少。Linux笔记是一个通用型操作系统，而非专用型嵌入式操作系统。

Jack：说了这么多，还是要用中断才行。

我：是的。但是中断仅仅是最基本的方式。使用中断这种外部设备处理方式，有两个硬伤需要面对：

1、丢失中断问题：在中断响应代码里，一般都会调用cli()宏定义关闭中断，当中断完成之后，再调用sti()宏定义打开中断。如果中断响应代码执行时间比较长（毫秒级别），那么在这段时间内，中断都无法响应——这对于一个server操作系统来说，是无法接受的。

2、SMP均衡问题：在SMP下，常用的中断默认只会落到CPU0上去，其余的CPU无法处理中断，这对整个操作系统的可扩展性来说，是致命的。

这两个问题对所有外部设备都适用，如果外部设备对性能要求非常之高，那么，这两个问题一定要解决。

Jack：常见的对性能要求非常之高的外部设备有哪些呢？

我：最常见的是网卡设备和磁盘设备。其中，对于网卡设备而言，这两个问题尤其棘手。

Jack：对于网卡设备而言，这两个问题是怎么解决的呢？

我：对于中断丢失的问题，Linux内核早期采用了BH的机制。而对于SMP的问题，Linux内核至今没有完美的解决办法。当然，这并不是说就没有解决的办法，只是有些互联网公司没把核心技术开源出来而已。

Jack：BH机制是怎么回事呢？

我：BH是bottom half的缩写，但是BH已经是一个专有名词，代表最早的Linux内核的bottom half机制，而bottom half是一个通用名词。Linux内核从程序猿的角度把中断响应程序分为两部分——上半部、下半部。上半部做标记功能用，下半部根据上半部的标记干活。上半部与下半部的本质区别是，上半部可以关闭中断，而下半部不能关闭中断。所以，bottom half的概念，完全是hacker意淫出来的，并非是CPU层面的概念。

Jack：那BH这种意淫出来的机制的好处在哪里呢？

我：这种机制的优点在于解决了第一个问题——丢失中断。通过把上半部极致地浓缩，可以最大限度地减少关闭中断的时间，从而减少中断丢失——没有绝对的不丢失中断，只能最大限度地减少中断丢失。

Jack：那BH机制的缺点是什么呢？

我：这个问题问得很好，不仅问了有点是什么，同时问了缺点是什么。两个点你都弄清楚了，差不多就高潮了。

Jack：去死吧。

我：BH机制的缺点在于无法解决第二个问题。就是BH机制在SMP下，表现得太龊逼了。

Jack：仔细一点呢？

我：BH硬编码定义了32类Bottom half，这32类botton half在同一时刻只能执行其中一种，即便是在SMP环境下，也是如此。所以，BH机制是绝对的串行化，而没有任何并发能力。

Jack：绝对的串行化也很好，实现非常简单，只是无法发挥多核的优势。

我：这种说法等于上馆子吃饭只喝水不点菜、不叫饭，因为这样省钱。但是这样的做法，是SB的。

Jack：那么Linux在处理外部设备的性能问题上，如何解决SMP的呢？

我：在Linux2.6版本内核里，提供了3种成熟的方法来解决外设与SMP配合的问题：软中断、tasklet、工作队列。其中，软中断是一种全新的机制，具备在SMP下软中断类型间的并发甚至是同种软中断内的并发能力。tasklet建立在软中断之上，是软中断的一种特例，相比于软中断，tasklet不具备同种软中断内的并发能力。对于除磁盘设备、网卡设备而言，几乎所有的外部设备用tasklet就够了。只有极少数的外部设备需要自己定制软中断。当然了，软中断的定制不是那么简单的。且不说需要对软中断的原理、实现代码非常熟悉。更难的是，需要自己实现软中断在SMP下，同种软中断内部间的互斥与同步。如果采用简单粗暴的spinlock，那么软中断在性能上就已经失去意义。而采用别的数据结构实现数据同步与互斥，又具备相当大的难度，所以，即便是Linux内核的官方版本，对这个问题也是极为头疼。至于第三种——工作队列。这种机制与前两种机制的最大差别在于，这种机制的bottom half会通过内核线程进入休眠，之后被唤醒。这里有两个难点，第一点是，休眠会引起上下文切换（context switch），对性能具有极大的杀伤。第二点是，Linux内核作者是非常反对user创建内核线程的——原因不言而喻，Linux内核是内核作者写好对外提供服务的，你一来就动大手术，把内核改造了，加了线程，谁能保证在某种情况下不出现问题呢？出了问题之后，会找谁解决呢？一般人当然首先先到内核作者。可是，当你找到内核作者的时候，情形好比是你把一台刚买的笔记本用螺丝刀打开过了，还下了几个零件，然后电脑坏了，你对售后服务说“我的电脑坏了，你帮我修理下。”

分享到：