存储器类型
ESP32 芯片具有不同类型的存储器和灵活的存储器映射特性,本小节将介绍 ESP-IDF 默认如何使用这些功能。
ESP-IDF 区分了指令总线(IRAM、IROM、RTC FAST memory)和数据总线 (DRAM、DROM)。指令存储器是可执行的,只能通过 4 字节对齐字读取或写入。数据存储器不可执行,可以通过单独的字节操作访问。有关总线的更多信息,请参阅 ESP32 技术参考手册 > 系统和存储器 [PDF]。
DRAM(数据 RAM)
非常量静态数据(.data 段)和零初始化数据(.bss 段)由链接器放入内部 SRAM 作为数据存储。此区域中的剩余空间可在程序运行时用作堆。
通过应用 EXT_RAM_BSS_ATTR
宏,零初始化数据也可以放入外部 RAM。使用这个宏需要启用 CONFIG_SPIRAM_ALLOW_BSS_SEG_EXTERNAL_MEMORY。详情请见 允许 .bss 段放入片外存储器。
如果使用蓝牙堆栈,内部 DRAM 区域的可用大小将减少 64 KB(由于起始地址移动到 0x3FFC0000
)。如果使用内存跟踪功能,该区域的长度还会减少 16 KB 或 32 KB。由于 ROM 引起的一些内存碎片问题,不可能将所有可用的 DRAM 用于静态分配,但是剩余的 DRAM 在运行时仍可用作堆。
备注
ESP32 上有 520 KB 的可用 SRAM(320 KB 的 DRAM 和 200 KB 的 IRAM)。 但是,由于技术限制,用于静态分配的 DRAM 最多可为 160 KB。 剩余的 160 KB(DRAM 总共 320 KB)只能在运行时分配为堆。
常量数据也可能被放入 DRAM,例如当它被用于 non-flash-safe ISR 时(具体请参考 如何将代码放入 IRAM)。
"noinit" DRAM
可以将 __NOINIT_ATTR
宏用作属性,从而将数据放入 .noinit
部分。放入该部分的值在启动时不会被初始化,在软件重启后也会保持值不变。
通过使用 EXT_RAM_NOINIT_ATTR
宏,noinit 数据也可以放入外部 RAM 中。为此,需要启用 CONFIG_SPIRAM_ALLOW_NOINIT_SEG_EXTERNAL_MEMORY,可参考 允许 .noinit 段放入片外存储器。如果没有启用 CONFIG_SPIRAM_ALLOW_NOINIT_SEG_EXTERNAL_MEMORY, EXT_RAM_NOINIT_ATTR
会和 __NOINIT_ATTR
一样,将数据放入内部 RAM 的 .noinit
部分。
示例:
__NOINIT_ATTR uint32_t noinit_data;
IRAM(指令 RAM)
ESP-IDF 将内部 SRAM0 的部分区域分配为指令 RAM。可在 ESP32 技术参考手册 > 系统和存储器 > 内部存储器 [PDF] 中查看 IRAM 区域的定义。该内存中第一个 64 KB 块用于 PRO 和 APP MMU 缓存,其余部分(即从 0x40080000
到 0x400A0000
)用于存储需要从 RAM 运行的应用程序部分。
何时需要将代码放入 IRAM
以下情况时应将部分应用程序放入 IRAM:
如果在注册中断处理程序时使用了
ESP_INTR_FLAG_IRAM
,则中断处理程序必须要放入 IRAM。更多信息可参考 IRAM 安全中断处理程序。可将一些时序关键代码放入 IRAM,以减少从 flash 中加载代码造成的相关损失。ESP32 通过 MMU 缓存从 flash 中读取代码和数据。在某些情况下,将函数放入 IRAM 可以减少由缓存未命中造成的延迟,从而显著提高函数的性能。
如何将代码放入 IRAM
借助链接器脚本,一些代码会被自动放入 IRAM 区域中。
如果需要将某些特定的应用程序代码放入 IRAM,可以使用 链接器脚本生成机制 功能并在组件中添加链接器脚本片段文件,在该片段文件中,可以给整个目标源文件或其中的个别函数打上 noflash
标签。更多信息可参考 链接器脚本生成机制。
或者,也可以通过使用 IRAM_ATTR
宏在源代码中指定需要放入 IRAM 的代码:
#include "esp_attr.h"
void IRAM_ATTR gpio_isr_handler(void* arg)
{
// ...
}
放入 IRAM 后可能会导致 IRAM 安全中断处理程序出现问题:
IRAM_ATTR
函数中的字符串或常量可能没有自动放入 RAM 中,这时可以使用DRAM_ATTR
属性进行标记,或者也可以使用链接器脚本方法将它们自动放入 RAM 中。void IRAM_ATTR gpio_isr_handler(void* arg) { const static DRAM_ATTR uint8_t INDEX_DATA[] = { 45, 33, 12, 0 }; const static char *MSG = DRAM_STR("I am a string stored in RAM"); }
注意,具体哪些数据需要被标记为 DRAM_ATTR
可能很难确定。如果没有被标记为 DRAM_ATTR
,某些变量或表达式有时会被编译器别为常量(即使它们没有被标记为 const
)并将其放入 flash 中。
GCC 的优化会自动生成跳转表或 switch/case 查找表,并将这些表放在 flash 中。IDF 默认在编译所有文件时使用
-fno-jump-tables -fno-tree-switch-conversion
标志来避免这种情况。
可以为不需要放置在 IRAM 中的单个源文件重新启用跳转表优化。关于如何在编译单个源文件时添加 -fno-jump-tables -fno-tree-switch-conversion
选项,请参考 组件编译控制。
IROM(代码从 flash 中运行)
如果一个函数没有被显式地声明放在 IRAM 或者 RTC 存储器中,则它会放在 flash 中。由于 IRAM 空间有限,应用程序的大部分二进制代码都需要放入 IROM 中。
允许从 flash 中执行代码的 Flash MMU 机制可参考 ESP32 技术参考手册* > 存储器管理和保护单元 (MMU, MPU) [PDF]。
在 启动 过程中,从 IRAM 中运行的引导加载程序配置 MMU flash 缓存,将应用程序的指令代码区域映射到指令空间。通过 MMU 访问的 flash 使用一些内部 SRAM 进行缓存,访问缓存的 flash 数据与访问其他类型的内部存储器一样快。
DROM(数据存储在 flash 中)
默认情况下,链接器将常量数据放入一个映射到 MMU flash 缓存的区域中。这与 IROM(代码从 flash 中运行) 部分相同,但此处用于只读数据而不是可执行代码。
唯一没有默认放入 DROM 的常量数据是被编译器嵌入到应用程序代码中的字面常量。这些被放置在周围函数的可执行指令中。
DRAM_ATTR
属性可以用来强制将常量从 DRAM 放入 DRAM(数据 RAM) 部分(见上文)。
RTC Slow memory(RTC 慢速存储器)
从 RTC 存储器运行的代码中使用的全局和静态变量必须放入 RTC Slow memory 中。例如 深度睡眠 变量可以放在 RTC Slow memory 中,而不是 RTC FAST memory,或者也可以放入由 ULP 协处理器编程 访问的代码和变量。
RTC_NOINIT_ATTR
属性宏可以用来将数据放入 RTC Slow memory。放入此类型存储器的值从深度睡眠模式中醒来后会保持值不变。
示例:
RTC_NOINIT_ATTR uint32_t rtc_noinit_data;
RTC FAST memory(RTC 快速存储器)
RTC FAST memory 的同一区域既可以作为指令存储器也可以作为数据存储器进行访问。从深度睡眠模式唤醒后必须要运行的代码要放在 RTC 存储器中,更多信息请查阅文档 深度睡眠。
RTC FAST memory 只可以被 PRO CPU 访问。
在单核模式下,除非禁用 CONFIG_ESP_SYSTEM_ALLOW_RTC_FAST_MEM_AS_HEAP 选项,否则剩余的 RTC FAST memory 会被添加到堆中。该部分内存可以和 DRAM(数据 RAM) 互换使用,但是访问速度稍慢,且不具备 DMA 功能。
具备 DMA 功能
大多数的 DMA 控制器(比如 SPI、sdmmc 等)都要求发送/接收缓冲区放在 DRAM 中,并且按字对齐。我们建议将 DMA 缓冲区放在静态变量而不是堆栈中。使用 DMA_ATTR
宏可以声明该全局/本地的静态变量具备 DMA 功能,例如:
DMA_ATTR uint8_t buffer[]="I want to send something";
void app_main()
{
// 初始化代码
spi_transaction_t temp = {
.tx_buffer = buffer,
.length = 8 * sizeof(buffer),
};
spi_device_transmit(spi, &temp);
// 其它程序
}
或者:
void app_main()
{
DMA_ATTR static uint8_t buffer[] = "I want to send something";
// 初始化代码
spi_transaction_t temp = {
.tx_buffer = buffer,
.length = 8 * sizeof(buffer),
};
spi_device_transmit(spi, &temp);
// 其它程序
}
也可以通过使用 MALLOC_CAP_DMA 标志来动态分配具备 DMA 能力的内存缓冲区。
在堆栈中放置 DMA 缓冲区
可以在堆栈中放置 DMA 缓冲区,但建议尽量避免。如果实在有需要的话,请注意以下几点:
如果堆栈在 PSRAM 中,则不建议将 DRAM 缓冲区放在堆栈上。如果任务堆栈在 PSRAM 中,则必须执行 片外 RAM 中描述的几个步骤。
在函数中使用
WORD_ALIGNED_ATTR
宏来修饰变量,将其放在适当的位置上,比如:void app_main() { uint8_t stuff; WORD_ALIGNED_ATTR uint8_t buffer[] = "I want to send something"; //否则 buffer 会被存储在 stuff 变量后面 // 初始化代码 spi_transaction_t temp = { .tx_buffer = buffer, .length = 8 * sizeof(buffer), }; spi_device_transmit(spi, &temp); // 其它程序 }