Toggle navigation
首页
问答
文章
积分商城
专家
专区
更多专区...
文档中心
返回主站
搜索
提问
会员
中心
登录
注册
Kernel
RT-Thread "骚操作"之信号量未释放导致设备逻辑卡死问题定位
发布于 2019-08-26 11:59:45 浏览:1443
订阅该版
[tocm] * 本帖最后由 liu2guang 于 2019-8-26 11:59 编辑 * 大家好,月底了,流光又准备给大家带来在 RT-Thread 遇到比较棘手的问题快速解决问题的 "骚操作"了,废话不多说我们直接进入正题。 **1. 信号量简介** 在 RT-Thread 上开发者除了线程使用最频繁之外一般就数 IPC 使用的最多了。信号量作为 IPC 中最基础和简单的一种, 是开发者爱不释手的一套开发逻辑的工具。那么笔者就在这里先简单说明下到底什么是信号量。 信号量是一种轻量的用于解决线程之间同步问题的内核对象,线程可以获取 (take) 或释放 (release) 它,从而达到同步或互斥的目的。以生活中的停车场为例来理解信号量的概念: 1. 当停车场空的时候,停车场的管理员发现有很多空车位,此时会让外面的车陆续进入停车场获得停车位; 2. 当停车场的车位满的时候,管理员发现已经没有空车位,将禁止外面的车进入停车场,车辆在外排队等候; 3. 当停车场内有车离开时,管理员发现有空的车位让出,允许外面的车进入停车场;待空车位填满后,又禁止外部车辆进入。 在这个例子中,管理员就相当于信号量, 管理员手中空车位的个数就是信号量的值,停车位相当于公共资源,正好与信号量的值匹配,车辆相当于线程。车辆通过获得管理员的允许取得停车位,就类似于线程通过获得信号量访问公共资源。 **2. 不匹配使用信号量会带来什么问题** 通过上面的例子我们能够简单的知道信号量是什么、有什么作用。既然这么好用,用的开发者这么多,那么相比就会有很多人错误的使用导致带来各种各样的问题。 在这里我们借助上文使用过的停车场的例子来说明可能在什么情况下出现什么问题: 1. 车辆有进有出,车辆出的速度比车辆进的速度快,这种情况下停车场的位置永远都会有位置,这属于正常情况; 2. 车辆有进有出,车辆进的速度比车辆出的速度快,这种情况下停车场的位置永远都是满的,但是由于还是有车辆出后续的车辆还是有机会可以进去的。这也属于输入正常情况。 3. 车辆只进不出,这种情况下,最开始车位都是空的,最开始的几辆车可以正常进到停车场中,但是随着时间推移,车辆不会出去,总有一个时刻车位满了,那么外面的车都只有永远等着。这就属于异常情况了。 根据上面停车场的例子我们来总结下问题: 1. 信号量的使用需要匹配使用。 2. 信号量获取 (take) 后在短而确定的时间内需要释放 (release) 掉,如果时间过长,系统的实时性会降低。如果时间时长时慢,系统的稳定性会下降。 3. 如果信号量只获取不释放那么整个系统就会导致逻辑卡死。 **3. 定位到底是 "谁" (thread) 只获取不释放** 好了,终于到了重点了(前面的废话真难编,咳咳咳... 好像说了什么不该说的)。 笔者在给大家说定位方法之前先在这里贴一段代码: ![clipboard.png](/uploads/201908/26/115554nxgsxeth0gv33glx.png) 相信这段代码大家能够看出问题所在,看不懂的,对不起出门右转(*^_^*)。 这段代码有个非常严重的问题,正常情况都是匹配使用,但是一但传入index大于2后就不会释放信号量,当没有其他的线程释放信号量的时候(只进不出)下次这个线程,获取其他线程需要获取这个信号量的时候就会 “逻辑卡死”。 其实这种代码都是很难避免的重来都不会出现,腿粗到没边的大神除外。那么作为非大神队列的我等普通人只有想办法出现这种问题后快速定位。 那么" 骚操作" 开始,这种问题难到我们难以定位到底是在哪里没有释放,因为 RTOS 有多任务调用。那么我们换一种思路,我们不去找代码是在哪里没有释放的,我们先确定在“逻辑卡死”的情况到底是那个线程将这个线程持有的,我们先缩小出问题的范围。 在现有的 RTT 内核代码中 IPC 只有保持阻塞线程队列,是没有保持持有线程队列的: > struct rt_ipc_object { struct rt_object parent; /**< inherit from rt_object */ rt_list_t suspend_thread; /**< threads pended on this resource */ }; struct rt_semaphore { struct rt_ipc_object parent; /**< inherit from ipc_object */ rt_uint16_t value; /**< value of semaphore. */ }; typedef struct rt_semaphore *rt_sem_t; 那么我们来改造下内核代码,既然没有保存,那么我们来手动保持下,这里我们简化下,我们不保存获取线程的队列,我们只保持下最后一个获取的线程的线程名。 在 rtdef.h 文件中我们做如下改造: > struct rt_semaphore { struct rt_ipc_object parent; /**< inherit from ipc_object */ char name[RT_NAME_MAX]; /**< name of take thread */ rt_uint16_t value; /**< value of semaphore. */ }; typedef struct rt_semaphore *rt_sem_t; 我们有地方存储这个名称变量了,那么我们还需要在获取时保持线程名,在 ipc.c 中做如下改造: > rt_err_t rt_sem_take(rt_sem_t sem, rt_int32_t time) { // ... if (sem->value > 0) { /* semaphore is available */ sem->value --; /* enable interrupt */ rt_hw_interrupt_enable(temp); /* 保持线程名 */ rt_strncpy(sem->name, rt_thread_self()->name, RT_NAME_MAX); } else { /* no waiting, return with timeout */ if (time == 0) { // ... } else { // ... /* reset thread error number */ thread->error = RT_EOK; RT_DEBUG_LOG(RT_DEBUG_IPC, ("sem take: suspend thread - %s
", thread->name)); /* 获取不到信号量时,打印最后一次持有的线程的线程名 */ if(!rt_strncmp(sem->parent.parent.name, "heap", 4)) { rt_kprintf("###### current last take sem thread: %s ######
", sem->name); } /* suspend thread */ rt_ipc_list_suspend(&(sem->parent.suspend_thread), thread, sem->parent.parent.flag); // ... } } RT_OBJECT_HOOK_CALL(rt_object_take_hook, (&(sem->parent.parent))); return RT_EOK; } 在上面代码我们可以看见,我们修改了2个地方 1. 在信号量值大于 0 时,保持当前线程名,这样就可以永久将信号量句柄中的线程变量,保存为最后持有的线程的名字 2. 在信号量 == 0 时,我们将持有线程的名字打印出来,这里笔者做了一个限制,我们只关注我们需要关注的信号量,所以做了个对比,非我们关注的信号量我们都不保持线程名,这样日志会变少。 到这一步我们就改造完毕日志了,将补丁打进 逻辑卡死 的工程中,等待打印: **###### current last take sem thread: xxx ######** 这样我们就缩小问题出现的反馈,接下来就需要分析到底线程那段代码卡死的了。对了打印这样不一定是问题哦,只有确定了有信号量导致逻辑卡死才能利用这个方法。互斥锁也可以使用这种方式确定问题出现在那个线程中。 **4. 代码编写建议** 容易漏掉释放一般都是函数推出位置不统一导致,可能今天写了不会缺少,过了几个月后再来写,添加了一个return就非常容易忘记释放信号量。 所以建议:函数最好是有统一出口,信号量的释放和获取最好都放到统一的出口处。 是不是很简单啊~,(咳嗽, 这个月笔者肚子中的墨水又干了,泡水恢复墨水去了),嗯,就这样,我们下期再见~~~
查看更多
1
个回答
默认排序
按发布时间排序
jamguo
2019-08-26
这家伙很懒,什么也没写!
厉害!学习学习了!加油!
撰写答案
登录
注册新账号
关注者
0
被浏览
1.4k
关于作者
liu2guang
这家伙很懒,什么也没写!
提问
14
回答
100
被采纳
4
关注TA
发私信
相关问题
1
请教cpu使用率分析
2
选择FreeRTOS, 还是RT-Thread。
3
thread heap stack overflow ?
4
rtt消息队列delay问题
5
释放被删除线程的内存地方在哪里啊
6
请教:各线程结束后,释放其中的内存的连续性问题
7
STM32F103中断关于信号量、邮箱问题
8
RTT中的线程栈大小如何控制
9
关于线程由执行态变为挂起态的代码实现,,,
10
rt_malloc(rt_size_t size)内存分配函数最小分配尺寸问题
推荐文章
1
RT-Thread应用项目汇总
2
玩转RT-Thread系列教程
3
国产MCU移植系列教程汇总,欢迎查看!
4
机器人操作系统 (ROS2) 和 RT-Thread 通信
5
五分钟玩转RT-Thread新社区
6
【技术三千问】之《玩转ART-Pi》,看这篇就够了!干货汇总
7
关于STM32H7开发板上使用SDIO接口驱动SD卡挂载文件系统的问题总结
8
STM32的“GPU”——DMA2D实例详解
9
RT-Thread隐藏的宝藏之completion
10
【ART-PI】RT-Thread 开启RTC 与 Alarm组件
最新文章
1
【24嵌入式设计大赛】基于RT-Thread星火一号的智慧家居系统
2
RT-Thread EtherKit开源以太网硬件正式发布
3
如何在master上的BSP中添加配置yml文件
4
使用百度AI助手辅助编写一个rt-thread下的ONVIF设备发现功能的功能代码
5
RT-Thread 发布 EtherKit开源以太网硬件!
热门标签
RT-Thread Studio
串口
Env
LWIP
SPI
AT
Bootloader
Hardfault
CAN总线
FinSH
ART-Pi
USB
DMA
文件系统
RT-Thread
SCons
RT-Thread Nano
线程
MQTT
STM32
RTC
FAL
rt-smart
ESP8266
I2C_IIC
WIZnet_W5500
UART
ota在线升级
PWM
cubemx
freemodbus
flash
packages_软件包
BSP
潘多拉开发板_Pandora
定时器
ADC
GD32
flashDB
socket
中断
Debug
编译报错
msh
SFUD
keil_MDK
rt_mq_消息队列_msg_queue
MicroPython
ulog
C++_cpp
本月问答贡献
踩姑娘的小蘑菇
7
个答案
3
次被采纳
a1012112796
16
个答案
2
次被采纳
张世争
9
个答案
2
次被采纳
rv666
6
个答案
2
次被采纳
用户名由3_15位
13
个答案
1
次被采纳
本月文章贡献
程序员阿伟
9
篇文章
2
次点赞
hhart
3
篇文章
4
次点赞
大龄码农
1
篇文章
5
次点赞
RTT_逍遥
1
篇文章
2
次点赞
ThinkCode
1
篇文章
1
次点赞
回到
顶部
发布
问题
分享
好友
手机
浏览
扫码手机浏览
投诉
建议
回到
底部