如何优化MCU SPI驱动程序以实现高ADC吞吐速率

随着技术的进步,低功耗物联网(iot)和边缘/云计算需要更精确的数据传输。图1展示的无线监测系统是一个带有24位模数转换器(adc)的高精度数据采集系统。在此我们通常会遇到这样一个问题,即微控制单元(mcu)能否为数据转换器提供高速的串行接口。
本文描述了设计mcu和adc之间的高速串行外设接口(spi)关于数据事务处理驱动程序的流程,并简要介绍了优化spi驱动程序的不同方法及其adc与mcu配置。本文还详细介绍了spi和直接存储器访问(dma)关于数据事务处理的示例代码。最后,本文演示了在不同mcu(aducm4050、max32660)中使用相同驱动程序时adc的吞吐率。
图1. 状态监控。
通用spi驱动程序简介
通常,mcu厂商会在例程代码中提供通用的spi驱动程序/api。通用spi驱动程序/api通常可以涵盖大多数用户的应用,这些代码可能包含许多配置或判断语句。但在某些特定情况下,比如adc数据采集,通用的spi驱动程序可能无法满足adc数据的全速的吞吐速率需求,因为通用的驱动程序中有过多的配置,而未使用的配置会产生额外的开销并导致时间延迟。
图2. 通用api的配置。
设计思路与实践框架
我们通常会选择低功耗高性能的mcu作为主机通过spi提取adc的输出数据。但是,由于adi的spi驱动程序的数据事务处理命令存在冗余,因此数据输出速率可能被显著降低。为了充分释放adc的潜在速率,本文使用aducm4050和ad7768-1进行实验并尝试可能的解决方案。尽管在使用默认滤波器的情况下,aducm4050的最大数据输出速率可达256 khz,但在当前情况下,其速率被限制在8 khz。提高输出速率的潜在解决方案包括删除不必要的命令以及激活dma控制器。本文将在以下小节中介绍这些思路。
图3. 不同odr以及drdy与sclk之间的关系。
以mcu作为主机
aducm4050 mcu是一款主时钟速率为26 mhz的超低功耗微控制器,内核为arm® cortex®-m4f处理器。aducm4050配有三个spi,每个spi都有两个dma通道(接收和发射通道)可与dma控制器连接。dma控制器和dma通道可实现存储器与外设之间的数据传输。这是一种高效的数据分配方法,可将内核释放以处理其他任务。
以adc作为从机
ad7768-1是一款24位低功耗、高性能的σ-δ adc。其数据输出速率 (odr)和功耗模式均可根据用户的要求进行配置。odr由抽取系数和功耗模式共同决定,如表1中所示。
表1. 数据输出速率的功耗模式配置
ad7768-1的连续读取模式也是该产品的一个重要特性。adc的输出数据存储在寄存器0x6c中。一般而言,每次读/写操作之前,adc寄存器中的数据都需要地址才可以访问,但是连续读取模式则支持在收到每个数据就绪信号后直接从0x6c寄存器提取数据。adc的输出数据为24位的数字信号,对应的电压如表2 所示。
表2. 数字输出码和模拟输入电压
引脚连接示意图
aducm4050和ad7768-1组成的数据事务处理示例模型的引脚连接如图4所示。
图4. ad7768-1和aducm4050的接口引脚连接。
adc的复位信号引脚rst_1连接至mcu的gpio28,而数据就绪信号引脚drdy_1则连接至mcu的gpio27。其余引脚则根据通用的spi配置标准进行连接,其中mcu为主机,而adc为从机。sdi_1接收mcu发送的adc寄存器读/写命令,而dout_1则将adc的输出数据发送至mcu。
数据事务处理的实现
中断数据事务处理
为实现连续数据事务处理,本文将mcu的gpio27引脚(连接至adc 的drdy_1引脚)用作中断触发引脚。adc将数据就绪信号发送至 gpio27时会触发mcu包含数据事务处理命令的中断回调函数。如图5所示,数据采集必须在中断a和中断b之间的时间间隔内进行。
图5. 两次中断的时间间隔。
利用adi的spi驱动程序可以在adc和mcu之间轻松实现数据事务处理。但是,由于驱动程序内存在冗余命令,adc的odr会被限制在8 khz。本文尽可能地精简了代码以加快odr,将介绍实现dma 数据事务处理的两种方法:基本模式的dma事务处理和乒乓模式 的dma事务处理。
基本模式的dma事务处理
在实现每个dma事务处理之前需要对spi和dma进行配置(参见图6 中的示例代码)。spi_ctl为spi配置,其值为0x280f,源于adi的spi 驱动程序的设定值。spi_cnt为传输字节数。由于每个dma事务处理只能发送固定的16位数据,因此spi_cnt必须是2的倍数。本例设置spi_cnt为4,以满足adc的24位的输出数据要求。spi_dma寄存器为spi的dma使能寄存器,设定其值为0x5以使能dma接收请求。命令padi_dma0->en_set=(1dstaddr_clr和padi_ dma0->rmsk_clr必须在首次中断触发之前在主函数中设置。前一个为dma通道目标地址减量使能清零寄存器,用于在增量模式下设置每次dma传输后的目标地址移位(目标地址计算函数仅在增量模式下有效)。后一个为dma通道请求屏蔽清零寄存器,用于将通道的dma请求状态清零。
基本模式的dma事务处理时间图如图7a所示。图中三个时隙分别代表drdy信号、spi/dma设置和dma数据事务处理。在该模式中,cpu的空闲时间较多,因此希望dma控制器在处理数据传输时能将任务分配给cpu。
图7. (a)基本模式dma和(b)乒乓模式的时间图。
乒乓模式的dma事务处理
在执行伪读取命令后,dma控制器会开始数据事务处理,从而使得mcu的cpu处于空闲状态而不处理任何任务。如果能够让cpu和 dma控制器同时工作,那么任务处理就从串行模式转变为并行模式。这样,就可以同时进行dma配置(通过cpu)以及dma数据事务处理(通过dma控制器)。为实现这一思路,需要设置dma控制器处于乒乓模式。乒乓模式将两组dma结构进行了整合:主结构和备用结构。每次dma请求时,dma控制器会在两组结构之间自动切换。变量p的初始设置为0,其值表示是主dma结构(p = 0) 还是备用dma结构(p = 1)负责数据事务处理。如果p = 0,则在收到伪读取命令时启动主dma结构进行数据事务处理,同时会为备用dma结构分配值,使其在下一个中断周期内负责数据事务处理。如果p = 1,则主结构和备用结构的作用互换。当仅有主结构处于基本dma模式时,在dma事务处理期间对dma结构的修改会失败。乒乓模式使得cpu能够访问和写入备用dma结构,而dma控制器可以读取主结构,反之亦然。如图7b所示,由于dma的结构配置是在最后一个周期内完成的,因此在drdy信号从adc传送至 mcu后dma数据事务处理可以被立即执行,使得cpu和dma同时工作而无需等待。现在,adc的odr得到了提升空间,因为总的工作时间已大大缩短。
中断处理程序的优化
两次drdy信号之间的时间间隔不仅包括了中断回调函数的命令执行时间,还包括了adi的gpio中断处理函数的命令执行时间。
当mcu启动时,cpu会运行启动文件(即startup.s)。所有事件的处理函数均在该文件中定义,包括gpio中断处理函数。一旦触发gpio中断,cpu就会执行中断处理函数(即adi的gpio驱动程序中的gpio_a_int_handler和gpio_b_int_handler)。通用的中断处理函数会在所有的gpio引脚中搜索触发中断的引脚并清零其中断状态、运行回调函数。由于drdy是本文应用的唯一中断信号,因此可以对函数进行简化以加快进程。可选的解决方案包括 (1)在启动文件中重新定位目标,以及(2)修改原始的中断处理函数。重新定位目标意味着自定义中断处理函数,并替换启动文件中的原始的中断处理函数。
而修改原始的中断处理函数只需要添加一个自定义的gpio驱动程序。本文采用第二种方案修改原始的中断处理函数,如图8所示。该方案只将连接至drdy的gpio的引脚中断状态清零,并直接转到回调函数。请注意,这里需要通过取消选择build target中关于原始gpio驱动函数的勾选框内容来隔离原始的gpio驱动程序。
图8. 嵌套矢量中断控制器(nvic)。
结果
速率性能
假定现在需要读取200个24位的adc输出数据,并且spi位速率设置为13 mhz。将drdy信号和sclk信号的引脚连接至示波器,可以通过观察drdy信号与spi数据事务处理(亦即dma事务处理)启动之间的时间间隔的方法可以量化本文所述的每种方法对速率的改善程度。这里将drdy信号至sclk信号开始的时间间隔记为∆t,那么对于13 mhz的spi速率,测量得出的∆t为:
(a)基本模式dma δt = 3.754 μs 
(b)乒乓模式dma δt = 2.8433 μs 
(c)乒乓模式dma(使用优化的中断处理函数)δt = 1.694 μs 
方法(a)和(b)可支持64 khz的odr,而方法(c)可支持128 khz的odr。这是因为方法(c)的∆t最短,从而使得sclk信号能够更早结束。如果 sclk信号(即数据事务处理)能在t/2之前完成(t为当前adc的数据输出周期),则odr可实现翻倍。这较之于原始的adispi驱动程序可以达到的8 khz的odr性能是一次巨大的进步。
图9. (a)基本模式dma、(b)乒乓模式以及(c)乒乓模式(使用优化的中断处理函数)的δt。
使用max32660控制ad7768-1
使用主时钟速率为96 mhz的mcu max32660控制ad7768-1)时的结果如何?在该情况下,使用优化的中断处理函数的中断设置,可在不使用dma函数的情况下实现256 khz的数据输出速率。参见图10。
图10. 不使用dma时max32660的odr。
结论
本文利用选定的adc(ad7768-1)和mcu(aducm4050或max32660)通过 spi实现了高速的数据事务处理。为实现速率优化的目标,本文简化了adi的spi驱动程序执行数据事务处理。此外本文提出,激活dma控制器释放内核也可以加快连续数据事务处理的流程。在 dma的乒乓模式下,dma的配置时间可通过适当的调度来节省。在此基础上,还可以通过直接指定中断引脚的方式优化中断处理函数。在13 mhz的spi位速率下,本文提出的方案的最佳性能可达到128 ksps的adc odr。
表5. 使用aducm405和max32660实现的高速spi连接
来源:adi智库
免责声明:本文为转载文章,转载此文目的在于传递更多信息,版权归原作者所有。本文所用视频、图片、文字如涉及作品版权问题,请联系小编进行处理


立库堆垛机实现自动化管理
华为P10闪存门最新消息:华为P10闪存门事件风波背后:从华为“闪存门”看国产手机之命门
我国成功发射遥感三十号 07 组卫星:一箭四星,长征火箭第 350 次飞行
泰克示波器的典型应用
华为FreeBuds 4无线耳机:主动降噪与舒适佩戴,体验二合一
如何优化MCU SPI驱动程序以实现高ADC吞吐速率
国外也玩应用双开,外国媒体送你荣耀7X手机6条小贴士_华为荣耀畅玩7x值得买吗
RISC-V或成为芯片行业的Linux?
IoT对于低功耗的需求设计挑战与分析
优化电网建设_提升电网灵活度
无线移动领域的合并浪潮推动IC行业进一步整合
CAN-bus总线是什么?如何在一分钟内找到CAN总线的问题节点?
华米科技与中国田径协会正式签署合作协议 将助力中国田径运动的发展
lm324ad和lm324的区别 能否替换使用
点接触型二极管结电容小为什么适用高频电路?
使用串口服务器时需要考虑哪些问题
PXZ-FR-DRZ、DMAC-FR-DRZ和CZ-FR-DRZ三者不同光致发光效率的原因
PLC远程监控系统都具有哪些方面的优势
2017年中国厂商OLED面板出货量近1000万片,主要用于智能手机应用
针对单片机、RTOS基础的Linux知识汇总