设计与开发

单片机神经网络 电子器件的“中控室”:单片机MCU详解

小编 2025-08-01 设计与开发 23 0

电子器件的“中控室”:单片机MCU详解

上一篇(只有想不到,没有嵌不到,嵌入式系统科普 )文章介绍了嵌入式系统的组成部分。其中提到了单片机MCU,其实它也是一个小系统,它是控制电子产品的大脑。现如今,我们生活中的许多电器都含有单片机。例如:手机、电视机、冰箱、洗衣机、以及开关、LED等。那么,什么是单片机?它在这些电器中究竟做了些什么呢?以及是如何构成的?

它是如何诞生的

单片机诞生于1971年,经历SCM、MCU、SoC三大阶段。单片机由以前的1位、4位、8位、16位。早期的单片机都是4位或8位。其中最成功的是英特尔的8031,因为简单可靠而性能不错获得了很大的好评。此后在8031上发展出了MCS51系列单片机系统。基于这一系统的单片机系统直到现在还在广泛使用。

随着工业控制领域要求的提高,开始出现了16位单片机,但因为性价比不理想并未得到很广泛的应用。90年代后随着消费电子产品大发展,单片机技术得到了巨大的提高。如今已发展到32位甚至64位。90年代后随着消费电子产品大发展,单片机技术得到了巨大提高,相继诞生了一批经过市场考验获得良好口碑的单片机制造厂商。

“神通广大”,到哪儿都有它

实际工作中并不是任何场合都要求计算机有很高的性能。应用的关键看是否够用,是否有很好的性价比。单片机是电器动作的关键,是指挥硬件运行的。例如:接收按钮或按键的输入信号,按照事先编好的程序,指挥马达和LCD的外围功能电路动作。

为什么很多电器设备都要使用单片机呢?我们用一个点亮LED电路为例来说明。

(右)无单片机的电路是一个由LED,开关和电阻构成的简单电路。很显然,使用单片机的电路要复杂得多,而且设计电路还要花费精力与财力。这样看来使用单片机并没有什么优点,其实不然。

如果我们让这个电路做一些比较复杂的操作,会怎么样呢。例如:如果希望LED在按下开关后,经过一段时间再点亮或熄灭,那么,对于安装有单片机的电路来说,只需更改单片机中的程序就可以了,并不需更改原电路。另一方面,对于没有单片机的电路来说,就必须在元电路中加入定时器IC,或者用标准逻辑IC和FPGA构成逻辑电路,才能实现这个功能。也就是说,在更改和添加新功能时,带有单片机的电路显然更加容易实现。

单片机通常用于工业生产的控制、生活与程序和控制有关领域。由于单片机比专用处理器更适合应用于嵌入式系统,因此它得到了最多的应用。事实上单片机是世界上数量最多的计算机。现代人类生活中所用的几乎每件电子和机械产品中都会集成有单片机。手机、电话、计算器、家用电器、电子玩具、掌上电脑以及鼠标等电脑配件中都配有1-2部单片机。而个人电脑中也会有为数不少的单片机在工作。据了解,一辆汽车上要配备40多部单片机,复杂的工业控制系统上甚至可能有数百台单片机在同时工作。这样算下来,单片机的数量已经远超过地球人口的数量了。

那么“无所不能”的单片机都由哪些器件构成的?

以PC为例,一台计算机主要有这几个部位组成:中央处理单元CPU(进行运算、控制)、随机存储器RAM(数据存储)、存储器ROM(程序存储)、输入/输出设备I/O(串行口、并行输出口等)。在个人计算机上这些部份被分成若干块芯片,安装在一个被称之为主板的印刷线路板上。而在单片机中,这些部份全部被做到一块集成电路芯片中,所以就称为单片机,而且有一些单片机中除了上述部份外,还集成了其它部份如模拟量/数字量转换(A/D)和数字量/模拟量转换(D/A)等。此外,现在的单片机绝大多数都是基于冯·诺伊曼结构。

以51单片机为例,其功能组件及作用主要有:

1、CPU主芯片(内部通过总线连接扩展的设备)

2、时钟电路(为单片机提供震荡脉冲)

3、电源电路(为单片机提供电源)

4、内部数据存储器RAM(包括通用数据寄存器和专用寄存器SFR,主要是数据存储区。)

5、程序存储器ROM(主要是存储程序,51系列有4K内部程序ROM,可以外扩64K。)

6、并行端口4*8位(P0,P1,P2,P3主要是数据交换接口。)

7、串行口(TXD,RXD用于串口通信。)

8、中断系统(外中断0,定时计数T0,外中断1,定时计数T1,串口中断。)

9、定时/计数器(16位用于外部的计数和定时功能。)

在这些组成里,内存是单片机的记忆装置,主要记忆程序和数据,但ROM与RAM有所区别:

ROM是只读内存的简称。保存在ROM中的数据不能删除,也不会因断电而丢失。ROM主要用于保存用户程序和在程序执行中保持不变的常数。

RAM是可随机读/写内存的简称。可以随时读写数据,但关机后,保存在RAM中的数据也随之消失。主要用于存储程序中的变量。在单芯片单片机中,常常用SRAM作为内部RAM。SRAM允许高速访问,但是,内部结构太复杂,很难实现高密度集成,不适合用作大容量内存。除SRAM外,DRAM也是常见的RAM。DRAM的结构比较容易实现高密度集成,因此,比SRAM的容量大。但是,将高速逻辑电路和DRAM安装于同一个晶片上较为困难,因此,一般在单芯片单片机中很少使用,基本上都是用作外围电路。

工作原理

虽说CPU相当于人的大脑,但是它却不能像人的大脑一样,能有意识的、自发的思考。CPU只能依次读取并执行事先存储在内存中的指令组合。

单片机自动完成赋予它的任务过程,即一条条执行的指令过程,所谓指令就是把要求单片机执行的各种操作用的命令的形式写下来,这是在设计人员赋予它的指令系统所决定的,一条指令对应着一种基本操作;单片机所能执行的全部指令,就是该单片机的指令系统,不同种类的单片机,其指令系统亦不同。

所以必须把要把问题编成一系列指令,这一系列指令的集合就成为程序,程序需要预先存放在存储器中。存储器由许多存储单元组成,你可以想像成宾馆的房间,指令就存放在这些房间里,房间里的指令取出并执行就像入住要分配房间一样,每一个存储单元也必须被分配到唯一的地址号,该地址号称为存储单元的地址,这样只要知道了存储单元的地址,就可以找到这个存储单元,其中存储的指令就可以被取出,然后再被执行。

主流单片机

现在主流单片机有:

51系列单片机——对所有兼容Intel 8031指令系统的单片机的统称,51单片机是基础入门的一个单片机,还是应用最广泛的一种。

PIC系列单片机——用来开发的去控制外围设备的集成电路,有计算和记忆功能,处理能力一般,存储器容量也很有限。

AVR系列单片机——AVR最大的优点就是哈佛结构速度快;片上资源丰富;驱动能力强;功耗低;可选择型号种类多;性价比高;保密性好;带PWM脉冲宽度调制、串行外设接口SPI,片内RC 振荡器,SRAM比51大。

这些是应用最多的三大系列单片机。其主要特点就是:51系列单片机是冯.诺依曼结构,后两种是哈佛结构。

典型玩家介绍

经多年发展,MCU厂商可谓是多种多样。简单介绍下这个圈里典型玩家

1. 恩智浦(收购飞思卡尔)

单片机是基于80C51内核的单片机,嵌入了掉电检测、模拟以及片内RC振荡器等功能,这使51LPC在高集成度、低成本、低功耗的应用设计中可以满足多方面的性能要求。NXP的MCU几乎都是采用cortex-m系列架构。

2. 瑞萨电子

NEC电子和瑞萨科技于2010年4月1日通过合并诞生了“瑞萨电子”,现为全球首屈一指的微控制器供应商,也是SoC系统晶片与各式类比及电源装置等先进半导体解决方案的领导品牌之一。他们推出的针对中国市场的MCU产品RL78系列分为通用产品和集成LCD驱动的产品,通用产品的升级款又围绕着传感器、小系统、马达驱动等具体应用领域做了相应拓展。

3. 微芯科技(Microchip)(收购爱特梅尔(Atmel))

微芯科技是全球领先的单片机和模拟半导体供应商,微芯单片机是市场份额增长最块的单片机。 他们强调节约成本的最优化设计,使用量大、档次低、价格敏感的产品。

4.三星(Samsung)

三星单片机有KS51和KS57系列4位单片机,KS86和KS88系列8位单片机,KS17系列16位单片机和KS32系列32位单片机。

5. 意法半导体(ST)

意法半导体微控制器拥有一个强大的产品阵容,从稳健的低功耗8位单片机STM8系列,到基于各种ARM Cortex-M0和M0+、 Cortex-M3、Cortex-M4、Cortex-M7内核的32位闪存微控制器STM32家族。STM32系列32位微控制器基于Arm® Cortex®-M处理器,旨在为MCU用户提供新的开发自由度。它包括一系列产品,集高性能、实时功能、数字信号处理、低功耗/低电压操作、连接性等特性于一身,同时还保持了集成度高和易于开发的特点。

6. 英飞凌(Infineon)

其前身是西门子集团的半导体部门。英飞凌8位单片机能实现高性能的电机驱动控制,在严酷环境下(高温、EMI、振动)具有极高的可靠性。英飞凌针对中国市场推出的XMC1000工业单片机,在电机控制领域拥有很高的性价比。

7. 德州仪器(TI)

TI是全球领先的模拟及数字半导体 IC 设计制造公司。除了提供模拟技术、数字信号处理 (DSP) 以外,TI 在单片机领域也涉入较深,推出一系列的32位单片机,其中Piccolo系列微处理器最具代表性,具体型号如C2000和F28x系列。

8. 东芝(Toshiba)

东芝单片机的特点从4位机到64位,门类齐全。4位机在家电领域仍有较大的市场。8位机主要有870系列、90系列等,该类单片机允许使用慢模式,采用32K时钟时功耗低至10uA数量级。CPU内部多组寄存器的使用,使得中断响应与处理更加快捷。东芝的32位单片机采用MIPS3000ARISC的 CPU结构,面向VCD、数字相机、图像处理等市场。

9. Silicon Laboratories(芯科实验室)

Silicon Laboratories成立于1996年,位于美国德州奥斯汀市,是一家专业研发设计类比电路及混合信号IC的公司,为成长快速的通信产业设计等提供广大应用。在8051系列MCU领域居于领先军团行列。这家公司2013收购了一家叫Energy Micro的节能型MCU公司,所以产品有两个型号。

10. Maxim

Maxim的超低功耗32 位 Arm® Cortex®-M4 FPU微控制器(单片机),可以帮助您在任意地方收发其他超低功耗MCU的产品。超低功耗MCU系列产品既智能又省电。他们在去年发布了一款名为MAX78000的革命性芯片。这颗低功耗神经网络加速微控制器能将人工智能(AI)推向边缘端,更重要的是,因为其低功耗特性,那就意味着即使在将其应用在电池供电的物联网(IoT)设备里,芯片性能并未受到影响。

11. ADI

ADI提供日渐增多的DSP、混合信号控制处理器、嵌入式处理器和模拟微控制器产品,适合广泛的通用和专用需求。例如产品包括:带有微处理器的模数转换芯片ADuC844和ADuC846,用于IoT超低功耗MCU ADuCM4050。

12. 高通(Qualcomm)

高通的MCU主要应用于智能手机、平板电脑、无线调制解调器等等,功能非常强大。主要提供16位,32位MCU。

其余厂商见图片。

MCU作为微型计算机的一个重要分支,应用面很广,发展很快。自MCU诞生至今,已发展为上百种系列的近千个机种。而且随着半导体集成工艺的不断发展,MCU的集成度将更高、体积将更小、功能将更强。

NeurIPS 2022|仅用256KB就实现单片机上的神经网络训练

作者丨Lyken@知乎

来源丨https://www.zhihu.com/question/565161486/answer/2779305863

编辑丨极市平台

来宣传一下我们组最近的工作:仅用256KB就实现单片机上的神经网络训练(training,notinference),从此终端智能不再是单纯的推理,而是能持续的自我学习自我进化。

On-Device Training under 256KB Memory 说到神经网络训练,大家的第一印象都是 GPU + 服务器 + 云平台。传统的训练由于其巨大的内存开销,往往是云端进行训练而边缘平台仅负责推理。然而,这样的设计使得 AI 模型很难适应新的数据:毕竟现实世界是一个动态的,变化的,发展的场景,一次训练怎么能覆盖所有场景呢?

为了使得模型能够不断的适应新数据,我们能否在边缘进行训练(on-device training),使设备不断的自我学习?在这项工作中,我们仅用了不到 256KB 内存 就实现了设备上的训练,开销不到 PyTorch 的 1/1000,同时在视觉唤醒词任务上(VWW)达到了云端训练的准确率。该项技术使得模型能够适应新传感器数据。用户在享受定制的服务的同时而无需将数据上传到云端,从而保护隐私。

网站链接: https://tinytraining.mit.edu/

论文链接: https://arxiv.org/abs/2206.15472

Demo: https://www.bilibili.com/video/BV1qv4y1d7MV

代码链接: https://github.com/mit-han-lab/tiny-training

背景

设备上的训练(On-device Training)允许预训练的模型在部署后适应新环境。通过在移动端进行本地训练和适应,模型可以不断改进其结果并为用户定制模型。通过让训练更在终端进行而不是云端,我们能有效在提升模型质量的同时保护用户隐私,尤其是在处理医疗数据、输入历史记录这类隐私信息时。

然而,在小型的 IoT 设备进行训练与云训练有着本质的区别,非常具有挑战性,首先, AIoT 设备(MCU)的 SRAM 大小通常有限(256KB)。这种级别的内存做推理都十分勉强,更不用说训练了。再者,现有的低成本高效转移学习算法,例如只训练最后一层分类器 (last FC),只进行学习 bias 项,往往准确率都不尽如人意,无法用于实践,更不用说现有的深度学习框架无法将这些算法的理论数字转化为实测的节省。

最后,现代深度训练框架(PyTorch,TensorFlow)通常是为云服务器设计的,即便把 batch-size 设置为 1,训练小模型(MobileNetV2-w0.35)也需要大量的内存占用。因此,我们需要协同设计算法和系统,以实现智能终端设备上的训练。

▲ 传统框架训练需要的内存大大超过了智能终端设备的资源,我们所提出的协同设计,有效的将内存开销从几百 MB 降低至 256KB 以内。

方法

我们发现设备上训练有两个独特的挑战:(1)模型在边缘设备上是量化的。一个真正的量化图(如下图所示)由于低精度的张量和缺乏批量归一化层而难以优化;(2)小型硬件的有限硬件资源(内存和计算)不允许完全反向传播,其内存用量很容易超过微控制器的 SRAM 的限制(一个数量级以上),但如果只更新最后一层,最后的精度又难免差强人意。

为了应对优化的困难,我们提出了 Quantization-Aware Scaling(QAS)来自动缩放不同位精度的张量的梯度(如下左图所示)。QAS 在不需要额外超参数的同时,可以自动匹配梯度和参数 scale 并稳定训练。在 8 个数据集上,QAS 均可以达到与浮点训练一致的性能(如下右图)。

为了减少反向传播所需要的内存占用,我们提出了 Sparse Update,以跳过不太重要的层和子张的梯度计算。我们开发了一种基于贡献分析的自动方法来寻找最佳更新方案。对比以往的 bias-only, last-k layers update, 我们搜索到的 sparse update 方案拥有 4.5 倍到 7.5 倍的内存节省,在 8 个下游数据集上的平均精度甚至更高。

为了将算法中的理论减少转换为实际数值,我们设计了 Tiny Training Engine(TTE):它将自动微分的工作转到编译时,并使用 codegen 来减少运行时开销。它还支持 graph pruning 和 reordering,以实现真正的节省与加速。

与 Full Update 相比,Sparse Update 有效地减少了 7-9 倍的峰值内存,并且可以通过 reorder 进一步提升至 20-21 倍的总内存节省。相比于 TF-Lite,TTE 里经过优化的内核和 sparse update 使整体训练速度提高了23-25倍。

结论

在本文中,我们提出了第一个在单片机上实现训练的解决方案(仅用 256KB 内存和 1MB 闪存)。我们的算法系统协同设计(System-Algorithm Co-design)大大减少了训练所需内存(1000倍 vs PyTorch)和训练耗时(20 倍 vs TF-Lite),并在下游任务上达到较高的准确率。

TinyTraining 可以赋能许多有趣的应用,例如手机可以根据用户的邮件/输入历史来定制语言模型,智能相机可以不断地识别新的面孔/物体,一些无法联网的 AI 场景也能持续学习(例如农业,海洋,工业流水线)。

通过我们的工作,小型终端设备不仅可以进行推理,还可以进行训练。在这过程中个人数据永远不会上传到云端,从而没有隐私风险,同时 AI 模型也可以不断自我学习,以适应一个动态变化的世界!

相关问答

pic 单片机 的pic是什么意思?

1.PIC单片机(PeripheralInterfaceController)是一种用来开发和控制外围设备的集成电路(IC)。一种具有分散作用(多任务)功能的CPU。与人类相比,大脑就是C...

热动专业的全称?

能源与动力工程热动专业全称能源与动力工程,主要是学习热能动力工程有关设备运行和管理的基本训练。热动专业主干学科有:热能工程、动力工程、空调与制冷、计...

大家设计电路主要是用哪款EDA软件?初衷又是为什么呢?

电源开发离不开设计,那么都有那些软件来支持工程师们的工作呐?笔者整理了下电源电路设计常用软件合集。一、SPICE模拟电路仿真用于模拟电路仿真的SPICE(Simu...

python与人工智能有关系吗?

作为BAT的Java开发工程师来回答这个问题。人工智能它是一门科学,是近些年发展起来的,通过整合了计算机知识,心理学,数学,哲学等多个学科后,研究用于模拟...Pyt...

mcu是什么意思车上的_车坛

它连接着汽车所有的电路,属于汽车的中枢神经。作为汽车电子控制系统的核心,mcu必须有着耐高温和坚固的特性,使之在复杂的汽车内部环境中不容易损坏...

在线等: 单片机 培训哪家好?

[回答]技术服务:一、软件开发:承接软件或项目订单,按照客户要求完成订单合同内容。二、Oracle、DB2、SQL,mysql数据库部署、升级、迁移、故障排除和维保项...

电子信息工程考研可以考哪方面的研究生啊?..._考研_帮考网

从事单片机(8位的8051系列、32位的ARM系列等等)、FPGA(CPLD)、数字逻辑电路、微机接口(串口、并口、USB、PCI)的开发,更高的要求会写驱动程序、会写...

谁知道600791调研

即使人类能够制造出象大脑神经细胞那样复杂的元件,人类有没有技术将其“装配”得象大脑神经网络那样工作。目前的计算机能够这样快速地工作,其根本...

曾喆昭为人如何,知名度?

3技术专长编辑技术专长:熟悉单片机应用系统开发、大规模可编程逻辑器件CPLD/FPGA开发以及TMS54XXDSP应用系统开发。在神经网络理论与应用方面也取得了卓有成...

手机中的音频处理模块有什么用?

手机处理器CPU有分单多核。就是所谓的四核八核。安兔兔,3dmark这种软件就当做娱乐。CPU压力测试也有世界知名的网站。geekbench,NPU,是神经网络模块。RAM是...

猜你喜欢