用协处理器提高μc/os-ii的实时性
μc/os-ii是一种可移植、可固化、可裁剪及可剥夺型的多任务实时操作系统(rtos)。本文提出用双核单片机提高实时操作系统μc/os-ii实时性的新思路,给出以协处理器实现μc/os-ii时钟节拍的方法和步骤,测试并验证了该方法对应用系统实时性的提升以及计时精度的提高。
关键词 μc/os-ii hcs12x xgate实时性 协处理器
引言
μc/os-ii最多支持63个任务,并支持信号量、邮箱、消息队列等多种进程间通信机制;同时,用户可以根据需求对内核中的功能模块进行裁剪。将μc/os-ii应用到嵌入式系统中,对于提高产品的质量、缩短开发周期和降低成本都有重要的意义。
为了保证系统的实时性,μc/os-ii采用查表策略,使优先级最高的任务一旦进入就绪态就立刻可以运行。这种查表算法与应用系统的任务数目无关,执行时间是固定值,从而保证了系统的硬实时性。μc/os-ii实时内核中唯一一个执行时间受任务数目影响的函数是时钟节拍,时钟节拍的中断服务子程序需要遍历所有使用延迟函数的任务,故执行时间与任务数目有关,为非固定值。此外,时钟节拍的频率也不能太高,否则会因为cpu频繁加载中断服务子程序,导致加重了cpu负荷,影响μc/os-ii的实时性。
freescale公司的16位hcs12x(简称“s12x”)系列单片机引入了一个协处理器,名为“xgate”。与普通意义上的浮点协处理器不同,这个协处理器主要用来处理中断。如果采用协处理器来处理μc/os-ii时钟节拍的中断,那么主cpu无需频繁加载中断服务子程序,从而保证μc/os-ii内核的所有函数执行时间都为固定值。这样,μc/os-ii的实时性就得到了保证,还能以提高时钟节拍中断频率的方法提高应用系统定时的精度。
1 单片机中的协处理器
hcs12x系列单片机中的xgate协处理器是精简指令集(risc)结构的处理器,它的工作时钟频率是s12x主cpu的2倍。主cpu初始化系统时可决定使用或禁用xgate。若使用,则xgate在初始化后就独立地运行,并通过双端口ram与cpu交换数据,必要时向主cpu发中断请求。
xgate处理完所有的中断后进入休眠态,停止运行,直到下一次中断发生。xgate比较适合响应的中断主要是加载频率高的中断,或不带通信缓冲区的i/o中断,例如sci发送或接收中断、pwm输出中断等。而对于本身带发送、接收缓冲区的中断(如can中断、usb中断等),采用协处理器处理中断优势不明显。
μc/os-ii的时钟节拍中断是一个频繁发生的中断,所以很适合采用xgate来响应。以下重点介绍如何用xgate协处理器响应μc/os-ii的时钟节拍中断。
2 用xgate实现μc/os-ii的时钟节拍
μc/os-ii的时钟节拍中断可以采用单片机的实时中断(realtime interrupt,rti)来实现。当然也可以使用定时器中的计数器来产生时钟节拍,原理相同,方法近似。使用xgate来响应rti中断,实现时钟节拍时,xgate协处理器和主cpu的分工如表1所列。
表1 xgate与主cpu的分工
xgate负责响应rti中断,实现时钟节拍,并完成任务延时计数;在任务延时完成后,通知cpu进行任务调度。另外,xgate还用来响应其他中断,在需要任务调度时通知cpu。主cpu则只负责运行任务(包括系统任务)和任务调度,只有在需要任务调度时才会加载中断服务子程序。使用xgate来实现时钟节拍的具体设置步骤如下所述。
2.1 将rti中断的控制权交给xgate
为了将rti中断交由xgate来处理,系统初始化时需要设置s12x单片机中rti中断对应的中断控制寄存器。中断控制寄存器组成如下:
在s12x单片机中,每一个i/o中断都有一个中断控制寄存器与之对应。中断控制寄存器控制相应的中断是由s12x cpu响应还是由xgate来响应,以及该中断的优先级。
中断控制寄存器中,rqst位为1时,中断由xgate来响应;为0时,中断由s12x cpu响应。为了使用xgate来响应rti中断,需要将rti中断对应的中断控制寄存器的rqst位置1。priolvl\[2∶0\]保存的是对应中断的优先级,值越大,对应中断的优先级越高。如果这3位均为0,那么对应中断会被禁用。
设置中断控制寄存器可以调用编译器提供的一个函数route_interrupt。这个函数需要的参数是对应中断的中断向量相对中断向量表基址(0xff00)的偏移量,以及中断控制寄存器的值。设置rti中断控制寄存器的代码如下:
route_interrupt(0xf0, 0x81);
其中,0xf0是rti中断向量相对中断向量表基址的偏移量,0x81是要设置的中断控制寄存器的值。
2.2 xgate与s12x cpu的数据共享
xgate实现μc/os-ii的时钟节拍和s12x cpu实现任务调度,都需要访问与系统的任务控制块链表相关的变量,因此这些变量需要声明为xgate和s12x cpu的共享变量。共享变量的声明需要加上“volatile”类型声明,并使用“#pragma”预处理命令将其放在共享内存中。
s12x cpu的程序中声明如下:
#pragma data_seg shared_data
os_tcbvolatile*ostcbcur;//当前任务控制块指针
os_tcbvolatile*ostcbfreelist;//当前空闲任务控制块指针
os_tcbvolatile*ostcbhighrdy;//当前最高优先级任务控制块指针
os_tcbvolatile*ostcblist;//任务控制块链表入口指针
#pragma data_seg default
在xgate的程序中,需要使用extern声明这些变量,具体语句如下:
#pragma data_seg shared_data
externos_tcbvolatile*ostcbcur;//当前任务控制块指针
externos_tcbvolatile*ostcbfreelist;//当前空闲任务控制块指针
externos_tcbvolatile*ostcbhighrdy;//当前最高优先级任务控制块指针
externos_tcbvolatile*ostcblist;//任务控制块链表入口指针
#pragma data_seg default
2.3 xgate与s12x cpu的指针变量变换
因为xgate的内存空间编址与s12x cpu的内存空间编址不一样,所以在指针变量共享时会存在问题。cpu的内存空间和xgate的内存空间的差别如图1所示。
图1 s12x cpu与xgate的内存空间分配对比
从图1中可以看出,在s12x cpu的寻址空间中,0x1000~0x3fff为ram空间;而对xgate来说,ram空间的地址范围为0x8000~0xffff。如果xgate的程序直接使用cpu的指针变量,则会导致xgate访问地址空间0x1000~0x3fff,该区域对于xgate是flash,从而出错。为了正确地共享指针变量,在xgate中使用s12x cpu的指针变量时,需要对指针变量进行变换。s12x系列中不同单片机成员的地址分配可能有所不同。以mc9s12xdt512单片机为例,其内部共有8 kb非分页ram,可全都设为s12x cpu和xgate的共享内存。这8 kb ram在s12x cpu中的地址为0x2000~0x3fff;而在xgate中的地址为0xe000~0xffff,地址偏差为0xc000。因此,在xgate使用s12x cpu的指针变量时,将指针变量的值加偏移量0xc000,就可以在xgate程序中正常使用。
下面是xgate程序中一个指针变量变换的代码:
ldw r2,(r1,#0);r1中是指针变量的地址,将指针的值放到r2
addh r2,#$c0;将r2增加0xc000
mov r1,r2;将变换后的指针放到r1
ldb r3, (r1,#0);通过变换后的指针访问变量
在xgate协处理器中有8个寄存器,编译器使用其中的r1来传递参数,上面程序中的r2、r3是8个寄存器中的另外2个。
2.4 xgate与s12x cpu的通信
xgate处理rti中断时先完成指针变换,然后遍历μc/os-ii的所有任务控制块链表,对需要延时的任务进行延时计数器减1操作。若无需任务调度,则xgate回到休眠态,直到响应下一次中断。仅当某任务延时计数器递减到零时,该任务进入就绪态,需要任务调度时才通知s12x cpu进行任务切换。
在xgate的中断服务子程序中,中断标志指令sif用于向s12x cpu发出中断请求。该指令置位中断标志位,请求s12x cpu继续响应本次rti中断。在xgate的中断服务子程序中使用sif指令的代码如下(其中r5是协处理器xgate的8个寄存器之一):
cmp r5,#0 ;r5保存进入就绪态且优先级比当前运行任务高的任务数目
beq out;如果r5为0,那么无需任务调度
sif;如果r5不为0,那么需要通知s12xcpu进行任务调度
out: rti;中断子程序返回
由于遍历任务控制块链表和各任务延时计数器减1的操作,以及无需任务调度的rti中断响应都由xgate完成了,s12x cpu只需要响应确实需要进行任务调度的rti中断,使其中断服务子程序大大简化:
void ostickisr(void) {//s12x cpu时钟节拍中断服务
osintenter();//中断嵌套层数加1
xgif0_xgif_78 = 1;//清xgate中断
os_save_sp();//保存当前任务栈
osintexit();//中断嵌套层数减1并进行任务调度
asm{ rti }//中断返回
}
这样,cpu的rti中断服务子程序所要执行的代码是固定的,每次的运行时间也是固定值,因而μc/os-ii的实时性得到了确切的保证。
s12x cpu和xgate的程序流程如图2所示。
图2 s12x cpu和xgate的程序流程
2.5 设置xgate向量表
为了使xgate正常响应中断,需要把xgate的rti中断服务子程序地址写到xgate的中断向量表中。xgate的中断向量表的写法与cpu的中断向量写法类似,只是xgate的中断子程序可代入一个参数,需要将这个参数也写入中断向量表。
在xgate中断向量表的确定位置,写入rti中断服务子程序地址和参数变量,就可以使xgate在响应rti中断时进入rti中断服务子程序。
xgate的中断向量表的写法如下:
constxgate_tableentry xgate_vectortable[] = {/*通道0~8都是不能使用xgate来响应的中断,所以从通道9开始*/
{errorhandler, 0x09},//通道9,未使用
{errorhandler, 0x0a}, //通道10,未使用
…//其他通道,可以选择使用
{rti_handler, (int)ostcblist},//通道0x78,rti中断子程和参数,将控制块链表作为参数
{errorhandler, 0x79},//通道0x79,irq中断,未使用
};
其中,ostcblist是xgate响应rti中断时需要带入的参数,这里这个参数是μc/os-ii任务控制块链表的首地址;xgate_tableentry是一个编译器自定义的结构体变量类型;xgate_vectortable[]是xgate的中断向量表。写好xgate的中断向量表后,使用xgate实现μc/os-ii时钟节拍的设置过程就完成了。
3 效果测试与分析
为了验证用协处理器处理时钟节拍中断的效果,进行如下测试:在同一s12x单片机上,分别使用和不使用xgate处理μc/os-ii的时钟节拍中断。在两种情况下,建立同样的10个任务,时钟节拍中断服务子程序中同样只进行任务控制块链表遍历和延时计数器减1,不做任务调度。这样,μc/os-ii中会有一个任务总处于就绪态并一直运行,这个一直运行的任务会通过循环计数的方法在一个i/o端口上输出一个方波。在同样的总线时钟和同样频率的时钟节拍下,比较两种μc/os-ii输出的方波周期的差别。
测试的目的是,观察μc/os-ii的时钟节拍中断服务子程序的加载,对正在系统中运行的任务的影响。为了与xgate处理任务控制块链表遍历和延时计数器减1进行对比,未使用xgate的μc/os-ii中,s12x cpu的时钟节拍中断服务子程序只保留与xgate同样的操作。没有任务调度,也方便对系统中正在运行的任务输出的方波进行观察。
在不使用的xgate的μc/os-ii中,s12x cpu的rti中断的中断服务子程序代码如下:
interruptvoid ostickisr(void) {
os_tcb ptcb;
osintenter();//中断嵌套层数加1
os_save_sp();//保存当前任务堆栈指针
crgflg |= 0x80;//清rti中断标志位
ptcb = ostcblist; //获得中断控制块链表的表头指针
while (ptcb>ostcbprio != os_idle_prio) {//遍历所有的任务控制块
os_enter_critical();//进入临界段代码
if (ptcb>ostcbdly != 0) { //对延时计数器非零的任务延时计数器减1ptcb>ostcbdly;
}ptcb = ptcb>ostcbnext; //指向下一个任务控制块
os_exit_critical();//离开临界段代码
}
osintexit();//中断嵌套层数减1,必要时做任务调度
}
以上s12x cpu中断服务子程序共有220条指令,需运行538个周期。测试中采用了16 mhz的总线时钟和16 khz的μc/os-ii时钟节拍。可以估算出,每次中断服务子程序在s12x cpu中的运行时间为33.6 μs,约相当于62.5 μs时钟节拍的53%,即s12x cpu需要用一多半的时间响应时钟节拍中断,这显然是不可取的。
在μc/os-ii中用xgate处理时钟节拍中断时,当无需做任务调度时,xgate遍历10个任务的控制块链表,执行延时计数器减1操作,共需要148条指令。由于xgate是risc结构的处理器,指令执行时间多为1~2个周期,故执行148条指令共需要218个周期。在32 mhz时钟频率下,执行时间大约7 μs,仅相当于62.5 μs时钟节拍的11%。这说明,即使使用短至62.5 μs的时钟节拍,对xgate的占用率也并不高。
通过以上测试可看出,由单一cpu运行μc/os-ii,16 khz的时钟节拍导致s12x cpu频繁地加载中断服务子程序,占用超过了50%,严重地影响了任务的实时运行。故对于单一cpu,一般采用的时钟节拍频率不高于100 hz,此时计时精度为±10 ms,以避免时钟节拍中断占用大量cpu运行时间。
在用xgate处理μc/os-ii的时钟节拍时,16 khz的时钟节拍并未对s12x cpu的任务运行产生影响,这个频率的时钟节拍使μc/os-ii的定时精度高于±62.5 μs。利用协处理器xgate来处理μc/os-ii的时钟节拍,使主 cpu的执行时间为固定值,因而保证了任务的实时运行,提升了系统实时性,高频率的时钟节拍也提高了计时精度。
4 结论
μc/os-ii中,时钟节拍中断服务子程序需要遍历整个任务控制块链表,不同应用中任务数目不同,遍历整个任务控制块链表所花费的时间就不同。时钟节拍中断所带来的不确定性是影响μc/os-ii实时性指标的唯一因素。采用协处理器来实现μc/os-ii的时钟节拍可以很好地解决这个问题。
如果使用协处理器来响应μc/os-ii的时钟节拍中断,那么μc/os-ii任务控制块链表的遍历和延时计数器减1操作均由协处理器完成。主cpu只有在需要做任务调度时才会进入相应的中断服务子程序,因此主cpu运行中断服务子程序的时间是固定值。由于主 cpu的运行时间不会被时钟节拍中断占用,因而可以采用很高频率的时钟节拍来提高μc/os-ii的计时精度。
国内AI芯片发展如火如荼 未来市场发展空间广阔
电子入门指导
电力(EU)是什么意思
3GPP RAN4工作组将重新定义移动通信系统
深入了解不同类型的人工智能
用协处理器提高μC/OS-II的实时性
机器视觉光源照明设计的注意事项
TI推出 60 V、2.2MHz DC/DC转换器--TPS
去年买这四部手机的赚大了,非常保值!
自动控制与信号系统的区别?
Mayo Clinic正在安装AI驱动的患者分类和预测平台
ATUOCAD经验技巧44例
基于Wi-SUN协议的大规模网状网络解决方案
半导体材料应用有哪些_半导体材料应用领域介绍
利用WFM7100的CaptureVu功能加快设备开发和调试
4家LED照明企业中他们的LED照明业务表现究竟如何呢?
AI可以开始预测犯罪吗
预端接光缆系统为何引领数据中心趋势
关于电子负载使用的四个方案技巧
带触觉反馈的压电执行器 全新尺寸,非凡性能