串口驱动框架剖析及性能提升

前言:苦串口驱动久矣!
现状
串口驱动三种工作模式:轮询、中断、dma。
轮询模式占用 cpu 最高,但是实现也是最简单的;dma 占用 cpu 最少,实现也是最麻烦的;中断模式居中。
原串口驱动有以下几个问题:
1、中断模式,接收有缓存,发送没缓存
2、中断模式,读操作是非阻塞的,没有阻塞读;写操作因为没有缓存,只能阻塞写,没有非阻塞写。
3、中断接收过程,每往发送寄存器填充一个字符,就使用完成量等待发送完成中断,通过完成量进行进程调度次数和发送数据量同样多!
4、dma 模式比较复杂,在实现上更复杂。
a.首先,接收有两种缓存方案,一种没有缓存,借用应用层的内存直接做 dma 接收缓存;一种有缓存,用的和中断模式下相同的 fifo 数据结构。发送只有一种缓存方式,把应用层内存放到数据队列里做发送缓存。
b.无论哪种缓存方案,都没有考虑阻塞的问题。而是抛给串口驱动一个内存地址,就返回到应用层了。应用层要么动用 rt_device_set_rx_indicate rt_device_set_tx_complete 做同步——退化成 poll 模式,失去了 dma 的优势;要么继续干其它工作——抛给串口驱动的内存可能引入隐患。
c.为了防止 dma 工作的时候又有新的读写需求。
对串口驱动的期望
轮询模式不在今天讨论计划内。下面所有的讨论都只涉及中断和 dma 两种模式。
无论哪种工作模式,都应该有至少一级缓存机制。
无论哪种工作模式,都应该可以设置成阻塞或者非阻塞。
默认是阻塞 io 模式;如果想用非阻塞工作模式,可以通过 open 或者 control 修改。
读写阻塞特性是同步的,不存在阻塞写非阻塞读或者非阻塞写阻塞读两种模式。
阻塞读的过程是,没有数据永久阻塞;有数据无论多少(小于等于期望数据量),返回读取的数据量。
阻塞写的过程是,缓存空间为 0 阻塞等待缓存被释放;缓存空间不足先填满缓存,继续等待缓存被释放;缓存空间足够,把应用层数据拷贝到驱动缓存。最后返回搬到缓存的数据量。
非阻塞读的过程是,没有数据返回 0;有数据,从 fifo 拷贝数据到应用层提供的内存,返回拷贝的数据量。
非阻塞写的过程是,缓存为 0 ,返回 0;缓存不足返回写成功了多少数据;缓存足够,把数据搬移完,返回写成功的数据量。
无论是轮询、中断、dma 哪种模式,都应该可以实现 stream 特性。
中断模式下的理论实践
注:以下实现是在 nuc970 上完成的,有些特性可能不是通用的。例如,串口外设自带硬件 fifo ,uart1 是高速 uart 设备,fifo 有 64 字节。uart3 的 fifo 就只有 16 字节。
定义缓存数据结构
为实现上述需求,接收和发送都需要有如下一个 fifo
1struct rt_serial_fifo 2{ 3    rt_uint32_t buf_sz; 4    /* software fifo buffer */ 5    rt_uint8_t *buffer; 6 7    rt_uint16_t put_index, get_index; 8 9    rt_bool_t is_full;10}; 注:别问我为啥不用 ringbuffer
大部分还是借用 struct rt_serial_rx_fifo 的实现的。增加了个 buf_sz 由 fifo 自己维护自己的缓存容量
针对 fifo 特意定义了三个函数,
rt_forceinline rt_size_t _serial_fifo_calc_data_len(struct rt_serial_fifo *fifo)计算 fifo 中写入的数据量
rt_forceinline void _serial_fifo_push_data(struct rt_serial_fifo *fifo, rt_uint8_t ch) 压入一个数据(不完整实现,具体见下文)
rt_forceinline rt_uint8_t _serial_fifo_pop_data(struct rt_serial_fifo *fifo) 弹出一个数据(不完整实现,具体见下文)
读设备过程
读设备对应中断接收。
1rt_inline int _serial_int_rx(struct rt_serial_device *serial, rt_uint8_t *data, int length) 2{ 3    rt_size_t len, size; 4    struct rt_serial_fifo* rx_fifo; 5    rt_base_t level; 6 7    rt_assert(serial != rt_null); 8 9    rx_fifo = (struct rt_serial_fifo*) serial->serial_rx;10    rt_assert(rx_fifo != rt_null);1112    /* disable interrupt */13    level = rt_hw_interrupt_disable();1415    len = _serial_fifo_calc_data_len(rx_fifo);1617    if ((len == 0) &&                // non-blocking io mode18        (serial->parent.open_flag & rt_device_oflag_nonblocking) == rt_device_oflag_nonblocking) {19        /* enable interrupt */20        rt_hw_interrupt_enable(level);21        return 0;22    }23    if ((len == 0) &&                // blocking io mode24        (serial->parent.open_flag & rt_device_oflag_nonblocking) != rt_device_oflag_nonblocking) {25        do {26            /* enable interrupt */27            rt_hw_interrupt_enable(level);2829            rt_completion_wait(&(serial->completion_rx), rt_waiting_forever);3031            /* disable interrupt */32            level = rt_hw_interrupt_disable();3334            len = _serial_fifo_calc_data_len(rx_fifo);35        } while(len == 0);36    }3738    if (len > length) {39        len = length;40    }4142    /* read from software fifo */43    for (size = 0; size is_full = rt_false;5152    /* enable interrupt */53    rt_hw_interrupt_enable(level);5455    return size;56} 简单说明就是:关中断,计算缓存数据量,如果为空判断是否需要阻塞。拷贝完数据,开中断。
这里需要注意的是,拷贝完数据后 fifo 必然不会是 full 的,rx_fifo->is_full = rt_false 这句没有加在 _serial_fifo_pop_data 函数,所以上面说它的实现是不完整的。
写设备过程
写设备对应中断发送
1rt_inline int _serial_int_tx(struct rt_serial_device *serial, const rt_uint8_t *data, int length) 2{ 3    rt_size_t len, length_t, size; 4    struct rt_serial_fifo *tx_fifo; 5    rt_base_t level; 6    rt_uint8_t last_char = 0; 7 8    rt_assert(serial != rt_null); 910    tx_fifo = (struct rt_serial_fifo*) serial->serial_tx;11    rt_assert(tx_fifo != rt_null);1213    size = 0;14    do {15        length_t = length - size;16        /* disable interrupt */17        level = rt_hw_interrupt_disable();1819        len = tx_fifo->buf_sz - _serial_fifo_calc_data_len(tx_fifo);2021        if ((len == 0) &&                // non-blocking io mode22            (serial->parent.open_flag & rt_device_oflag_nonblocking) == rt_device_oflag_nonblocking) {23            /* enable interrupt */24            rt_hw_interrupt_enable(level);25            break;26        }2728        if ((len == 0) &&                // blocking io mode29            (serial->parent.open_flag & rt_device_oflag_nonblocking) != rt_device_oflag_nonblocking) {30            /* enable interrupt */31            rt_hw_interrupt_enable(level);3233            rt_completion_wait(&(serial->completion_tx), rt_waiting_forever);3435            continue;36        }3738        if (len > length_t) {39            len = length_t;40        }41        /* copy to software fifo */42        while (len > 0)43        {44            /*45             * to be polite with serial console add a line feed46             * to the carriage return character47             */48            if (*data == '' &&49                (serial->parent.open_flag & rt_device_flag_stream) == rt_device_flag_stream &&50                last_char != '')51            {52                _serial_fifo_push_data(tx_fifo, '');5354                len--;55                if (len == 0) break;56                last_char = 0;57            } else if (*data == '') {58                last_char = '';59            } else {60                last_char = 0;61            }6263            _serial_fifo_push_data(tx_fifo, *data);6465            data++; len--; size++;66        }6768        /* if the next position is read index, discard this 'read char' */69        if (tx_fifo->put_index == tx_fifo->get_index)70        {71            tx_fifo->is_full = rt_true;72        }7374        // todo: start tx75        serial->ops->start_tx(serial);7677        /* enable interrupt */78        rt_hw_interrupt_enable(level);79    } while(size ops->start_tx(serial) 用于开启发送过程(这个的实现可能在不同芯片上略有差异)。
中断接收
1        while (1) { 2            ch = serial->ops->getc(serial); 3            if (ch == -1) break; 4 5            /* if fifo is full, discard one byte first */ 6            if (rx_fifo->is_full == rt_true) { 7                rx_fifo->get_index += 1; 8                if (rx_fifo->get_index >= rx_fifo->buf_sz) rx_fifo->get_index = 0; 9            }10            /* push a new data */11            _serial_fifo_push_data(rx_fifo, ch);1213            /* if put index equal to read index, fifo is full */14            if (rx_fifo->put_index == rx_fifo->get_index)15            {16                rx_fifo->is_full = rt_true;17            }18        }1920        rt_completion_done(&(serial->completion_rx)); 先计算是否还有数据要发送,如果没有,调用 serial->ops->stop_tx(serial) 对应上面的 serial->ops->start_tx(serial) 。
因为硬件自带 fifo ,这里最多可以连续写 64 个字节。
因为发送 fifo 是往外弹出数据的,最后肯定是非满的。
未说明的问题
对于串口设备来讲,接收是非预期的,所以串口接收中断必须一直开着。发送就不一样了,没有发送数据的时候是可以不开发送中断的。
上文中提到的两个 ops start_tx stop_tx 正是开发送中断使能,关发送中断使能。另外,它俩还有更重要的作用。
在 nuc970 的设计上,只要发送寄存器为空就会有发送完成中断,并不是发送完最后一个字节才产生。正因为这个特性,当开发送中断使能的时候会立马进入中断。在中断里判断是否有数据要发送,刚好可以作为“启动发送”。
对于其它芯片,如果发送中断的含义是“发送完最后一个字节”,仅仅使能发送中断还不够,还需要软件触发发送中断。这是发送不同于接收的最重要的地方。
dma 模式下的实现探讨
为什么上一节叫实践,这一节变成探讨了?
第一,笔者还没时间在 nuc970 上完成 dma 的部分。
第二,有了上面中断模式的铺垫,dma 模式也是轻车熟路。不觉得 nuc970 的硬件 fifo 就是 dma 的翻版吗?
dma 模式需要二级缓存机制。第一级缓存和中断模式用的 fifo 一样。这样 read write 两个函数的实现可以是一样的。
在此基础上,增加一个数组。如下是完整串口设备定义:
1struct rt_serial_device 2{ 3    struct rt_device          parent; 4 5    const struct rt_uart_ops *ops; 6    struct serial_configure   config; 7 8    void *serial_rx; 9    void *serial_tx;1011    rt_uint8_t serial_dma_rx[64];12    rt_uint8_t serial_dma_tx[64];1314    cb_serial_tx _cb_tx;15    cb_serial_rx _cb_rx;1617    struct rt_completion completion_tx;18    struct rt_completion completion_rx;19};20typedef struct rt_serial_device rt_serial_t; 这两个数组作为 dma 收发过程的缓存。
发送数据时,从 serial_tx 的 fifo 拷贝数据到 serial_dma_tx ,启动 dma。发送完成后判断 serial_tx 的 fifo 是否还有数据,有数据继续拷贝,直到 fifo 为空关闭 dma 发送。
接收数据时,在 dma 中断里拷贝 serial_dma_rx 所有数据到 serial_rx 的 fifo 。如果 dma 中断分完成一半中断和全部传输完成两种中断。可以分成两次中断,每次只处理一半数据,这样每次往 fifo 倒腾数据的时候,还有一半缓冲区可用,也不至于会担心仓促。
我们需要做的工作只有“怎么安全有效启动 dma 发送。
底层驱动
以上都是串口设备驱动框架部分,下面说说和芯片操作紧密相关的部分
init 函数,负责注册设备到设备树。
configure 函数,负责串口外设初始化,包括波特率、数据位、流控等等。还有个重要的工作就是调用引脚复用配置函数。
control 函数,使能禁用收发等中断。
putc 函数,负责写发送寄存器,写寄存器前一定先判断发送寄存器是否可写是否为空,阻塞等。
getc 函数,负责读接收寄存器,读寄存器前一定先判断是否有有效数据,如果没有返回 -1。
start_tx 函数,使能发送中断,如果发送寄存器为空,触发发送中断。(如果芯片没有这个特性,需要想办法触发发送完成中断)
stop_tx 函数,禁用发送中断。
中断回调函数,负责处理中断,根据中断状态调用 rt_hw_serial_isr 函数。
实机验证
中断模式在 nuc970 芯片下经过千万级数据收发测试的考验。测试环境有如下两种:
1、非阻塞 io;波特率 9600;串口调试工具:usr-tcp232 ,usr 出的调试工具。
串口调试工具定时 50ms 发送 30 个字符。nuc970 接收到数据后返回接收到的数据。
2、阻塞 io;波特率 115200;串口调试工具:usr-tcp232 ,usr 出的调试工具。
串口调试工具定时 10ms 发送 30 个字符。nuc970 接收到数据后返回接收到的数据。(串口调试助手发送了 200w 字节数据,接收到了相同个数字符!)
结论
因为 nuc970 芯片的特殊性,上面虽说使用的是中断模式,其实和 dma 有点儿类似了。假如是没收发一个字节数据各对应一次中断,中断次数会比较多。
但是,在应用层来看,无论是中断还是 dma 都是一样的——要么阻塞,要么非阻塞。
原文标题:rt-thread驱动篇之串口驱动框架剖析及性能提升
文章出处:【微信公众号:rtthread物联网操作系统】欢迎添加关注!文章转载请注明出处。


苹果13新品发布时间什么时候
如何正确地选购笔记本电脑
木林森主营业务变为以照明品牌与照明渠道业务为主
时钟发生器是导致电磁辐射发射的主要原因
关于人工智能研究报告:发现的问题比能解决的多
串口驱动框架剖析及性能提升
vivo手机用什么充电宝最好,支持vivo快充的充电宝
2020年有哪些优秀的降噪耳机?蓝牙耳机前十排行榜推荐
基于以太网的SIMATIC NET服务器与S7-1200通信
基于ROS的机器人建图与导航仿真全过程
证券公司如何跨入智能化时代
黑莓9900奢华施华洛世奇水晶壳发布
HOLTEK新推出BS24系列Touch A/D OTP MCU
简述EMC分析时需考虑的5个重要属性及PCB的布局问题
从数据结构到Python实现:如何使用深度学习分析医学影像
智能家电组的创新方案
中经合注资台晶测电子:加大LED芯片测试服务
2021年中国的VR技术和应用与国际的差距逐步缩小,市场规模也在快速增长
全金属超薄淡香槟色千元平板,把玩儿高性价比小米平板3
为让海外投资者回归,韩国济州岛式要求设立区块链和加密货币特区