详解嵌入式软件开发到FPGA开发

写在最前面:
没错,我就是一名普普通通的工程师,有那么一两项能养活自己的技术。技术这个东西,如果只是用在工作岗位上的话,就是一个“搬砖”的工具,如果把它分享出来,没准还能碰撞出有意思的东西来,你们说是吧?
好了,这一系列博文教程叫做“fpga软硬件加速入门”,顾名思义,就是利用fpga本身的特点,在软硬件进行不同的系统分工,加速系统输出的速度(主要是计算),我会尽量从入门者的角度讲解相关内容,如果你觉得还行,挺受用,动一动手指,帮忙转发一下,不胜感激啦~
一、 从嵌入式软件开发到fpga开发
1.1 单片机开发流程浅析
在开始介绍fpga之前,让我们来回顾一下简单的嵌入式软件开发吧,相信大家或多或少都接触过单片机(micro control unit)的设计流程。作为一个简单的控制器,单片机的工作流程无非如下:
1、 单片机上电,程序从存储器中加载到mcu内部;
2、 根据单片机的输入(如键盘输入、传感器数据的读取等)、以及程序内部的逻辑,计算得到控制结果;
3、 将结果输出,控制单片机的外部设备(如led的亮灭、控制电机转速的pwm波形等);
也就是说,一个简单的单片机工作系统的构成如下:
而为了搭建上面的这样一个系统,我们在软件方面需要做的事情包括下面这几部分:
1、 代码编辑,这里主要包括输入输出设备驱动和内部的控制逻辑;
2、 代码编译,将源文件(.c或.cpp)转化为指定单片机可执行的二进制文件;
3、 可执行文件烧写,将二进制文件固话到单片机(内部或外部)的存储器中;
上面三个步骤,我们一般是在各种ide(integrated development environment)开发环境下实现的,也就是说在一个软件里面实现编辑、编译、烧写的功能,常见的ide软件如下:
1.2 从单片机开发到fpga开发
1.2.1 fpga的基本工作原理
在进行fpga开发之前,我们必须得了解为什么要使用fpga,也就必须得知道fpga的工作原理。我们知道,对于一个简单单片机系统来说,工作原理和上文描述一样,也就是说,对于一个简单的让led闪烁的功能,单片机要做的事情如下:
1、 从(内部或外部)的程序存储器中,取出一条让led点亮的指令;
2、 将该指令输入到cpu的指令译码器中,根据译码器的结果(此处是将控制led的gpio的输出寄存器的bit位拉高)控制相应寄存器;
3、 加载下一条延时指令,输入到译码器中,进行空操作处理;
4、 继续加载下一条让led灭的指令,译码后,控制gpio总线上的指定bit位拉低,从而熄灭led;
5、 循环上述操作达到闪烁led的目的;
通过上面闪烁led的例子,我们可以知道,对于单片机来说,它的核心有2点:
指令的加载、译码——其实也就是对指令集的解析,知道这一条语言到底进行了什么硬件上的操作,后面章节会详细的解释;
外设的控制——可以通过写寄存器控制单片机的外设,如gpio、uart、spi、iic等;
那么对于fpga而言呢?
无论是fpga、单片机,又或是arm系统、我们的pc,其实本质上就是一个计算平台,是一个信息处理系统。作为一个系统,它的输入、计算、输出的构成是永远不会变的。那变的是什么?变得是计算的原理。
对于单片机而言,取指、译码、输出是它的原理,那么对于fpga而言,它的原理又是什么?在介绍之前,我们先回顾一下《数字电路》这门课里面的基础内容——组合逻辑和时序逻辑电路。
d触发器是时许逻辑电路的基本组件,与、或、非们是组合逻辑电路的基本组建。利用这些组建我们可以实现很多小的功能。
比如,通过d触发器我们可以设计一个计数器:
比如,我们可以通过简单的组合逻辑来实现一个比较器
讲到这里,大家可能已经知道了,这两个简单的逻辑电路其实能够构成一个让led闪烁的简单系统。我们只需要将计数器的输出作为比较器的x输入,而另外一个固定的电平值(比如说8)作为y输入,那么每当x=y的时候,比较器的x=y都会输出一个高电平。而将x=y的输出作为另一个1位计数器的输入的时候,便会产生这么一个效果——每过8个时钟周期后,最后输出的电平就会反转一次,达到led闪烁的效果,整个电路的构成如下:
为什么在这里要讲led闪烁的数字电路构成呢?因为这正是fpga的工作原理!fpga全程field programmable gate array(现场可编程门阵列),这个“门”指的就是fpga内部芯片的主要组成部分——庞大数量的寄存器和门电路(详细的构成后面章节会介绍)。
至此,我们可以对比出单片机开发和fpga工作原理了。它们的异同点如下表:
1.2.2 为什么要用fpga
前面我们说到一个简单的控制led的例子,知道了整个流程是取指、译码、控制外设的流程。对于一个led电频翻转来说,mcu当然是足够的,我们思考一下以下几个问题:
1. 如果我要输出高清的60帧/s的1080p视频信号给显示器怎么办?用gpio控制?
2. 如果我要进行运算量非常大的程序,比如现在非常火的ai网络训练,涉及到大量的乘法、加法,用mcu?pc?
回答了上述几个问题也就解释了为什么要用fpga了。我们来挨个解释一下:
1. 用gpio翻转输出一个指定的电平需要几十个时钟周期(mcu的clock频率),如果我要输出一个60帧、1080p的视频信号的话(其实也是电平的控制),那么翻转的频率可能要达到百兆的速度了,如果使用mcu这种方式的话,mcu要达到几ghz的主频了,这显然是不现实的。而根据上面fpga的电平翻转的原理,d触发器的时钟频率只需要百兆就可以了;
2. 计算机基础告诉我们,无论是mcu还是pc的cpu,内部都有相应的乘法器和加法器。如果设计到大量的计算的话,单个乘法/加法器哪怕主频再高,计算速度也跟不上。而对于fpga来说,可以仿照上面计数器、比较器的方式,设计几十个、几百个甚至几千个计算单元,哪怕主频比cpu低很多,计算速度也远高于cpu。二者的关系可以用下图形象地表示:
fpga开发流程
二、fpga开发流程
fpga的开发有一个特点,即开发环境和使用的芯片有非常强的关联性。不像单片机开发的ide,一个开发套件可以适配几十上百家不同的单片机(各种51、pic、stm32等)。但目前主流的fpga芯片只有2家——xilinx(赛灵思)和altera(后被intel收购,我们姑且称之为英特尔的fpga吧)。
这系列博文主要集中在xilinx的fpga芯片及其相应的开发套件vivado上。
以比较常见的stm32系列单片机和集成开发环境keil为例,我们来对比一下单片机开发和fpga开发的流程。
可以看到,相对于单片机(更不用说普通的pc软件开发了),fpga的开发流程复杂了许多。工程么,不就是各种tradeoff,开发便利和计算性取舍,就是后话了~

大数据是工业的核心资源 企业入局需合理把握
PLC梯形图语言的编程原则
广立微正式加入UCIe产业联盟 国内首家加入该联盟的EDA上市公司
千元带人脸识别 只有华为畅享8能做到!
如何利用物联网为垃圾分类
详解嵌入式软件开发到FPGA开发
嵌入式系统测试的三道复习题资料概述
基于FM33LF013的油烟机风机变频驱动方案
顺络新品 | 适用于PSIP塑封工艺的新型贴片变压器
华为荣耀8、小米5C、360N5,开启2017第一波千元杀
大疆无人机创始人汪滔:中国无人机大王,让世界都羡慕的中国科技
分析STM32的三种上电启动过程
张平:5G现在还没有开始,我们首先要把基础做扎实,而不是去制造概念
售价最高100万 三星发布全新量子点8K电视
微流控时间分辨免疫荧光法——代际优势,降维打击
NB-IoT传输方式有哪几种?
TYPE-C|音视频采集卡简介及方案说明
浅谈可穿戴物联网设备的一些电源设计挑战
北斗导航定位芯片企业华大北斗荣获“星火”公益先锋奖
深度剖析锂电池电量监测原理4