ESP32 开发之:亚马逊 AWS 平台 OTA 升级过程完全梳理

开发 前端
本篇给大家介绍关于 ESP32 模组以及 MCU 的 OTA 升级过程,都是是一些结构性的流程节点,剩下部分就是一些细节问题了,按照官方文档的指导步骤,都可以顺利完成开发!

[[404000]]

在最近的两篇文章中,我们从概念和流程上梳理了: 一个终端设备如何把一个固件,安全无误的从服务器上,下载到本地。

文章链接在此:

  • 物联网设备OTA软件升级之:升级包下载过程之旅
  • 物联网设备OTA软件升级之:完全升级和增量升级

这篇文章就继续往下深入,以一个实际的 ESP32 项目,来完整的梳理一下 OTA 升级的全过程。

主要包括下面 3 部分内容:

  1. AWS 平台上,部署一个 OTA 升级任务时,需要完成哪些步骤;
  2. ESP32 模组中,关于 Flash 分区和 OTA 升级控制过程和代码说明;
  3. 如何通过 ESP32,给与之相连的 MCU 进行 OTA 升级;

PS: 在下面的内容中,终端设备指的就是 ESP32 模组。

ESP32 Flash 分区

其实 ESP32 的官方文档的过程描述,已经是非常的详细了。

不仅把每一个操作的步骤都写的很清楚,而且把一些可能遇到的错误,都会做一些善意的提醒。

下面这部分内容,基本上是来源于官方的文档。

我们这里只是把一些与本文相关的、比较重要的内容摘录在这里。

首先要了解的,肯定是 Flash 的分区信息了。

所有的固件、数据,都要存储在 Flash 中,它是一个系统的记忆部件,离开了它,再怎么聪明的 CPU 都无用武之地。

关于分区表,ESP32 中预定义了 2 份分区表,分别对应:是否存在 OTA 功能这两种情况,截图如下:

没有 OTA 的分区表:

有 OTA 功能的分区表:

官方的文档链接在这里: https://docs.espressif.com/projects/esp-idf/zh_CN/v4.3-beta3/esp32/api-guides/partition-tables.html。

既然我们是在描述 OTA 过程,那肯定就是以带有 OTA 功能的这个分区表为准了。


在这张分区表中,一共定义了 3 个应用程序分区:

  • factory 分区;
  • ota_0 分区;
  • ota_1 分区;

这三个分区的类型都是 app,但具体 app 的类型不相同。

其中,位于 0x10000 偏移地址处的为出厂应用程序(factory),其余两个为 OTA 应用程序(ota_0,ota_1)。

名为 otadata 的数据分区,用于保存 OTA 升级时需要的数据。

启动加载器会查询该分区(otadata)的数据,以判断:应该从哪个 OTA 应用程序分区来加载程序。

如果 otadata 分区为空(说明这台设备还没有进行过 OTA 升级),则会执行出厂程序,也就是执行 factory 分区中的固件程序。

如果 otadata 分区非空,则启动加载器将加载这个分区中的数据,进而判断: 启动哪个 OTA 镜像文件。

AWS 平台部署 OTA 升级任务

AWS 平台按照不同的业务类型,划分为不同的服务。这样处理起来,流程更规范,操作步骤也更多,当然也更赚钱一些!

从上一篇文章中可以看到,当一个新的固件准备好之后,需要做 2 件事情:

  • 把固件(bin 文件)和一个固件描述文件(json格式的文本文件),上传到 S3 云存储服务器上;
  • 在 AWS Core 任务管理中,新建一个升级任务(会得到一个 Job ID)。在这个任务中需要选择:
  • (1) 步骤1中上传的 json 文件;
  • (2) 哪些终端设备需要升级;

json 格式的固件描述文档,格式大概如下(可以根据实际的业务需求进行修改):

  1.   "product""产品名称"
  2.   "group""设备分组"
  3.   "firmware":  
  4.   [ 
  5.      { 
  6.         "ota_type""esp32"
  7.         "url""http://xxx/esp32-v1.1.0.bin"
  8.         "md5""xxx" 
  9.      } 
  10.   ] 

不知道您是否注意到:在 firmware 字段中,使用的是数组([...]),而不是对象({...})?

这样来组织的原因是,OTA 升级不仅仅可以对 ESP32 模组中的固件进行升级("ota_type": "esp32"),还可以对其他的一些固件或用户数据进行更新。

比如:更新 ESP32 串口连接的 MCU 中的固件程序。

对了,一个终端在通过网络连接到云平台时,都有一个唯一的 ID 编号,一般都是利用 ESP32 模组上的网卡 MAC 地址来作为唯一 ID。

当完成以上步骤时,在服务器端,就存在着一个升级任务关系链:

也就是说:一个 Job ID 就对应着一次 OTA 升级任务。终端设备在进行 OTA升级过程中,就是从这个 Job ID 开始的。

ESP32 OTA 升级的触发

ESP32 与 AWS 平台之间,是通过 MQTT 协议进行通信的。

因此,当运营人员创建了一个 OTA 升级任务后,所有相关的终端设备,必须从某个预先确定好的主题(topic)中,接收到 OTA 升级通知指令。

例如一个可能的 topic:$aws/things/xxx/job/notify

其中的 xxx,代表终端设备的 MAC 地址,只有这样,每一个设备才能够接收到属于自己的命令。

升级通知指令的内容中,一定会包含 OTA 升级的 Job ID,例如:

  1.   "timestamp""xxxxxx"
  2.   "job_id""001" 

当终端设备接收到这个升级通知指令时,提取出 job_id 字段,然后向云平台发起请求:获取与这个 job_id 关联的固件描述信息,也就是之前上传的 Json 格式的文件息。

AWS 平台接收到这个请求后,就会把与这个 job_id 相关联的 OTA 升级任务描述文件(json文件),发送给终端设备。

设备拿到了固件描述文件,自然也就知道了固件的:版本,下载地址,MD5 值等信息,于是就进入后面的下载环节了。

以上的过程描述,基本上是一个终端设备触发 OTA 升级的最基本的过程。

在实际的项目中,可能会遇到一些稍微复杂的情况。

例如:一个终端设备一直处于断电状态。此时,云平台中已经对固件进行了好几次的升级,但是由于这台设备一直没有运行,因此它的固件已经过时了好几个版本。

有一天,这台设备上电运行了,此时它会从云平台接收到好几个升级任务,这个时候应该如何处理呢?

也许,我们就要对升级通知的指令中,赋予更多详细的内容,让这台设备有足够的信息来判断该如何进行升级。

ESP32 固件下载和本地升级

ESP32 在提取出固件的下载地址(URL)之后,就开始进入下载环节了。

官方文档非常详细的描述了固件的下载过程。

下面这段代码,就是从官方文档中摘抄过来的:

链接地址:https://docs.espressif.com/projects/esp-idf/zh_CN/latest/esp32/api-reference/system/ota.html

  1. bool image_header_was_checked = false
  2. while (1) { 
  3.     int data_read = esp_http_client_read(client, ota_write_data, BUFFSIZE); 
  4.     ... 
  5.     if (data_read > 0) { 
  6.         if (image_header_was_checked == false) { 
  7.             esp_app_desc_t new_app_info; 
  8.             if (data_read > sizeof(esp_image_header_t) + sizeof(esp_image_segment_header_t) + sizeof(esp_app_desc_t)) { 
  9.                 // check current version with downloading 
  10.                 if (esp_efuse_check_secure_version(new_app_info.secure_version) == false) { 
  11.                     ESP_LOGE(TAG, "This a new app can not be downloaded due to a secure version is lower than stored in efuse."); 
  12.                     http_cleanup(client); 
  13.                     task_fatal_error(); 
  14.                 } 
  15.  
  16.                 image_header_was_checked = true
  17.  
  18.                 esp_ota_begin(update_partition, OTA_SIZE_UNKNOWN, &update_handle); 
  19.             } 
  20.         } 
  21.         esp_ota_write( update_handle, (const void *)ota_write_data, data_read); 
  22.     } 

把这个过程画成流程图,就是下面这个样子:

我们假设这次固件升级,存储在 ota_0 这个分区中。

在固件下载完毕之后,esp_ota_end() 函数会在 otadata 分区写入一个标记: 下次启动时,请加载 ota_0 分区中的固件程序。

当 ESP32 重新启动时,启动加载器从 otadata 分区读取数据,得知这一次需要启动 ota_0分区里的固件。

此时有一件很重要的事情需要做:当 ota_0 分区中的固件启动正确无误后,需要调用函数 esp_ota_mark_app_valid_cancel_rollback() 往 otadata 区写 ESP_OTA_IMG_VALID,标记: 这个分区中的固件是没有问题的!

这样的话,以后每次重启时,都会加载 ota_0 分区里的固件。

相反的情况:如果 ota_0 分区里的固件,在第一次启动后新固件运行有问题,需要调用函数 esp_ota_mark_app_invalid_rollback_and_reboot() 往 otadata 区写 ESP_OTA_IMG_INVALID,标记:这个分区中的固件有问题!

这样的话,重启之后,启动加载器将会选择之前的 app 分区里的固件,可能是 factory 分区,也可能是 ota_1 分区。

OTA 升级过程中断了,怎么办?

以上描述的过程都是理想的情况,那么如果遇到一些异常情况,该如何处理呢?

例如:从接收到固件描述信息,到固件下载完成。在这期间的任何一个时间点,如果因为断电等原因,导致设备重启了,该如何继续 OTA 升级过程?

我们知道,在程序运行的时候,所有的数据都是保存在内存中的。

重启之后,内存中的数据是一篇空白。

如果希望 OTA 升级过程可以在任何异常情况下都能顺利进行,必须保存一些必要的信息,包括:

  1. json 格式的固件描述文件;
  2. 固件下载过程中已经完成的每一个阶段;

这些信息可以调用 nvs_write() 函数,保存在非易失性存储设备中。

即使系统因为断电等原因重启了,也可以通过 nvs_read() 函数,读取之前已经完成的步骤,然后继续后续的升级操作。

通过 ESP32,升级 MCU 固件

ESP32 模组,仅仅是一个用来连接网络云平台的无线设备。

对于一个实际的产品而言,发挥实际功能控制作用的,往往是另一片单片机,比如: STM32。

单片机中的固件也有可能需要进行 OTA 升级,此时 ESP32 就要作为中间的一个媒介,先把 MCU 固件下载下来存储在本地,然后再通过串口发送给单片机。

在这种情况下,ESP32 接收到的 OTA 固件描述信息就有可能是下面这个样子:

  1.   "product""产品名称"
  2.   "group""设备分组"
  3.   "firmware":  
  4.   [ 
  5.      { 
  6.         "ota_type""stm32"
  7.         "url""http://xxx/mcu-v1.2.3.bin"
  8.         "md5""xxx" 
  9.      } 
  10.   ] 

从 ota_type 字段,可以知道这次是给 MCU 进行升级,接下来的下载过程就与上述流程很类似了。

唯一的区别就是:下载的时候,需要把固件保存到 Flash 上的一块独立的数据分区中,而不是 ota_0 或 ota_1 分区。

至此,关于 ESP32 模组以及 MCU 的 OTA 升级过程就基本描述完毕了。

以上这些内容,都是是一些结构性的流程节点,剩下部分就是一些细节问题了,按照官方文档的指导步骤,都可以顺利完成开发!

 

责任编辑:姜华 来源: IOT物联网小镇
相关推荐

2021-06-02 07:58:58

物联网设备OTA

2021-05-31 07:49:58

物联网OTA软件

2015-10-09 10:50:54

AWSAWS IoT

2013-05-08 09:24:40

云开发平台AWS价格云服务价格

2014-11-14 10:16:18

亚马逊

2014-11-14 10:08:07

AWSAWS Lambda

2013-12-06 10:36:03

谷歌计算引擎亚马逊

2012-09-28 10:05:52

2022-04-08 11:39:26

OTA操作说明鸿蒙

2015-04-10 09:43:40

AWS

2015-10-09 10:13:33

亚马逊AWSAWS IoT

2013-12-18 17:22:54

亚马逊AWS

2015-04-10 09:16:28

亚马逊AWS机器学习

2016-03-08 15:02:18

GMGC

2021-04-24 07:52:34

设备升级OTA

2011-10-10 14:21:18

系统管理自动化

2014-11-14 09:19:23

AWSAmazon Auro

2015-09-28 10:09:48

亚马逊AWSAWS认证

2014-12-12 11:18:14

2013-11-12 09:25:55

微软Azure亚马逊AWS
点赞
收藏

51CTO技术栈公众号