C 随机硬故障-STM32F4-FreeRTOS

C 随机硬故障-STM32F4-FreeRTOS,c,stm32,freertos,stm32f4,C,Stm32,Freertos,Stm32f4,我有一块运行FreeRTOS的STM32F4板(上面有3个任务),我每使用15-50分钟就会遇到一次硬故障 我的硬件: 直流电机的3个编码器、6个模拟输入、10个数字输入和3个PWM输出 一开始,我认为是堆栈溢出,而不是我实现的uxTaskGetStackHighWaterMark(),并检查它是否不是它 然后,我实现了一些硬故障处理程序: void HardFault_Handler(void) { __asm volatile ( " tst l

我有一块运行FreeRTOS的STM32F4板(上面有3个任务),我每使用15-50分钟就会遇到一次硬故障

我的硬件: 直流电机的3个编码器、6个模拟输入、10个数字输入和3个PWM输出

一开始,我认为是堆栈溢出,而不是我实现的
uxTaskGetStackHighWaterMark(),并检查它是否不是它

然后,我实现了一些硬故障处理程序:

   void HardFault_Handler(void)
{
    __asm volatile
    (
            " tst lr, #4                                                \n"
            " ite eq                                                    \n"
            " mrseq r0, msp                                             \n"
            " mrsne r0, psp                                             \n"
            " ldr r1, [r0, #24]                                         \n"
            " ldr r2, handler2_address_const                            \n"
            " bx r2                                                     \n"
            " handler2_address_const: .word prvGetRegistersFromStack    \n"
    );
}

void prvGetRegistersFromStack( uint32_t *pulFaultStackAddress )
{
    volatile uint32_t CFSRValue = SCB->CFSR;
    volatile uint32_t HFSRValue = SCB->HFSR;
    char stepError [100] = "";
    if ((HFSRValue & (1 << 30)) != 0) {
        CFSRValue >>= 16;
        if((CFSRValue & (1 << 9)) != 0) strcpy(stepError," Divide by zero");
        if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
        if((CFSRValue & (1 << 3)) != 0) strcpy(stepError," No coprocessor UsageFault" );
        if((CFSRValue & (1 << 2)) != 0) strcpy(stepError," Invalid PC load UsageFault");
        if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
        if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
    }

    volatile uint32_t r0;
    volatile uint32_t r1;
    volatile uint32_t r2;
    volatile uint32_t r3;
    volatile uint32_t r12;
    volatile uint32_t lr; /* Link register. */
    volatile uint32_t pc; /* Program counter. */
    volatile uint32_t psr;/* Program status register. */

    r0 = pulFaultStackAddress[ 0 ];
    r1 = pulFaultStackAddress[ 1 ];
    r2 = pulFaultStackAddress[ 2 ];
    r3 = pulFaultStackAddress[ 3 ];

    r12 = pulFaultStackAddress[ 4 ];
    lr = pulFaultStackAddress[ 5 ]; 
    pc = pulFaultStackAddress[ 6 ];
    psr = pulFaultStackAddress[ 7 ];
    GPIO_WriteLed(0,1);
    for(int i=0;i<=10;i++)
    {
        PWM_Change_DutyCycle(i,0);
    }
    for(;;);
}
void硬故障处理程序(void)
{
__挥发性物质
(
“tst lr,#4\n”
“ite均衡\n”
mrseq r0,msp\n
mrsne r0,psp\n
“ldr r1,[r0,#24]\n”
ldr r2,句柄2\u地址\u常数\n
“bx r2\n”
“handler2\u地址\u常量:。字prvGetRegistersFromStack\n”
);
}
void prvGetRegistersFromStack(uint32\u t*pulFaultStackAddress)
{
易失性uint32\u t CFSRValue=SCB->CFSR;
挥发性uint32\u t HFSRValue=SCB->HFSR;
字符步进错误[100]=“”;
如果((HFSRValue&(1>=16;
如果((CFSRValue&)(1
  • 问题并没有明确说明,但据我所知,这个线程并不是关于硬故障来自何处,而是到目前为止所显示的测试想法是否正确,以及还可以做些什么来定位错误

  • 这个问题现在已经很老了,但是这个板是为了帮助其他有同样问题的人,所以让我们带着对这些问题的普遍兴趣来阅读Q&AQ


  • 为了追溯问题,以下策略可以提供帮助:

    • 如果您可以应用跟踪硬件(因为硬件目标支持它,并且您有足够的昂贵设备…),请使用它:片外ETM跟踪和硬故障处理程序中的经典断点,您的搜索可能会在50分钟后完成

      我想在目前的情况下,这些条件没有得到满足。 尽管如此,在一些专业项目中,设计另一个PCB并购买一个好的调试/跟踪适配器比让一些开发人员搜索几个星期要便宜。 也许对您来说,具有完整JTAG/TPIU访问的STM32评估板是一个部分解决方案

    • 有相当多的错误模型,其中硬故障处理程序向您报告的地址与错误源无关。 不过,通过检查(使用内存映射)地址所属的函数或变量/缓冲区,您可能会得到一些有用的想法。 通过在模块之间放置未使用的“间隔”缓冲区(一个或几个字就足够了),修改错误环境,然后重新运行测试。 如果在这些未使用的区域中写入一些神奇的模式,则可以监视它们是否损坏,并将它们用作“”来检测错误发生的上下文

    • 如果这没有帮助,请逐步停用软件的不同组件,并在硬故障消失时重新运行和检查。 如果之前还没有,您可能需要一些自动化的耐久性测试环境,这样您的努力(和搜索时间)就不会爆炸

    • 据我所知,所有 有一个内存保护单元。 你能激活它吗


    您认为在这里发布异常处理程序比发布生成异常的代码更有益吗?我将处理程序发布给您,您知道这些值(CFSR、pc等)如果您阅读了我的问题,每个异常都发生在代码的一个不同部分。osSystickHandler、IncrementTick等是FreeRTOS的默认值,我没有碰它。如果它不是堆栈溢出,那么它可能是通过一个游离点写入的呃,或者缓冲区溢出,或者其他。如果没有看到代码,就不可能说。只有应用程序代码超过5000行。:/我在这里尝试一些可能有用的东西。。如果我拔下直流电机(仍然发送PWM,但没有编码器脉冲),崩溃需要更多的时间(到目前为止,已经5个小时没有例外).可能是上下文切换方面的问题?恐怕只有您才能找到HF的源代码。如果不访问您的机器和硬件,就不可能远程调试复杂的代码
    1- if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state"); pc=0
    
    2- if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
        0800807d: ...IncrementTick+252   ldr     r3, [r7, #8]   -  pc=134250621 - lr=2779096485
    
    
    3-  if((CFSRValue & (1 << 8)) != 0) strcpy(stepError," Unaligned access");
        0800d63b: MX_ADC1_Init+290       ldr     r3, [pc, #240]  ; (0x800d72c <MX_ADC1_Init+532>)
    
    
    4-  if((CFSRValue & (1 << 1)) != 0) strcpy(stepError," Invalid state");
            addr 0
    
    5-080124c9: SysTick_Handler+8      bl      0x80072cc <osSystickHandler>
    
    
    6-  if((CFSRValue & (1 << 0)) != 0) strcpy(stepError," Undefined instruction");
        08012521: SysTick_Handler+8      bl      0x80072cc <osSystickHandler>