Toggle navigation
首页
问答
文章
积分商城
专家
专区
更多专区...
文档中心
返回主站
搜索
提问
会员
中心
登录
注册
C语言
深入理解 C 语言的 hello world
发布于 2021-12-20 10:14:31 浏览:1474
订阅该版
[tocm] ### 引言 在学习C语言或者其他编程语言的时候,我们编写的一个程序代码,基本都是在屏幕上打印出 *hello world* ,开始步入编程世(深)界(坑)的。C 语言版本的 hello world 代码: ``` #include
int main() { printf("hello world\n"); return 0; } ``` 不用多说,这段程序在运行时,会在显示终端上打印出 *hello world* 。 那么,这段程序背后关联的内容,你是否真正梳理明白了呢? * 源程序代码是如何编译成可执行程序的? * `#include
` 的作用是什么? * hello world 程序是怎样运行起来的? * printf 是怎样将字符串 "hello world" 输出到终端的? * hello world 程序在运行时,它在内存中是什么样子的? * 程序的执行入口为什么是 main 函数? * 可执行文件的内部结构是怎么样的? 闲话少说,让我们进入正题,扒一扒 hello world 背后的内幕。 注:本文是在 Ubuntu 环境下对程序的编译和运行进行实验,相关内容以 Linux 系统为主。 ### 程序编译 在 Linux 系统或者其他环境下,将源码编程成可执行程序,很简单。点击编译按钮或者输入编译指令即可完成。例如,在 Linux 下,用 gcc 编译此程序代码,然后运行: ``` $ gcc hello.c -o hello $ ./hello hello world ``` 但是,你知道编译器干了哪些工作吗?编译器将源代码文件编程成可执行程序,经历了四步:编译预处理、编译、汇编、链接。 ![image-20211217013100341.png](https://oss-club.rt-thread.org/uploads/20211220/521b026520a9e7db4264ea041c4ad4b9.png) **1. 编译预处理** 编译预处理过程主要是处理源代码文件中,以 “#” 开头的预编译指令。例如,“#inlude”、“#define”等。 预处理器根据以字符 “#” 开头的指令,修改原始的 C 程序文件,生成一个以 .i 为扩展名的程序文件。 本例中,`#include
` 命令告诉预处理器,读取系统头文件 stdio.h 的内容,并把它插入到源程序文本中。 在 Linux 环境下,可以通过如下指令得到预处理完成后的 .i 文件 ``` $ gcc -E hello.c -o hello.i ``` 这个文件内容比较长,如果有兴趣的话可以自己进行实验,查看一下。 **2. 编译** > 编译的过程就是把预处理完的文件,进行一系列的词法分析、语法分析、语义分析以及优化后,生成相应的汇编代码文件。这个过程往往是整个程序构建的核心部分。 将 hello.i 文件翻译成文本文件 hello.s,其内部是一个汇编语言的程序。 通过如下指令可以得到汇编文件 ``` $ gcc -S hello.i -o hello.s ``` **3. 汇编** 汇编器将上一步生成的汇编代码翻译成机器可以执行的指令,把这些指令打包成可重定位目标程序,保存在目标文件 hello.o 中。 可以通过下边的指令生成: ``` $ gcc -c hello.s -o hello.o ``` 文件 hello.o 是一个二进制文件。 **4. 链接** hello 程序调用了 printf 函数,这是 标准 C 库中的一个函数。printf 函数存储在一个预编译好的目标文件 printf.o 中,链接器负责将这个文件以某种方式合并到 hello.o 程序中。 合并处理后,得到一个可执行目标文件 hello,这个可执行文件可以由系统加载运行。 ### 程序运行 hello.c 程序已经被编译可执行的目标文件 hello,且存在磁盘上。那这个程序是如何运行起来的呢? 当然,你可以说,通过如下指令可以运行程序: ``` $ ./hello hello world ``` 但是,从计算机角度来说,运行这个程序需要做哪些工作呢? 当输入 “./hello” 后,shell 开始处理这条指令。 首先,shell 加载可执行文件 hello,复制目标文件 hello 中的代码和数据到内存中。 数据和指令加载完成后,处理器开始执行 hello 程序中 main 函数的机器指令。这些指令将 “hello world” 字符串中的字节复制到寄存器文件,再从寄存器文件中复制显示设备上,最终在屏幕上显示出来。 ![image-20211219003231205.png](https://oss-club.rt-thread.org/uploads/20211220/0aaf489453d30f138b8a111b2658cde7.png) 其实,操作系统在加载程序后,还做了一些工作,用于准备 main 函数执行需要的环境,然后调用 main 函数。 ### 可执行程序文件 在 Linux 下,可执行文件的存储格式为 ELF(Executable Linkable Format)。那么其内部结构是什么样的呢? 典型的 ELF 可执行文件的布局情况如下: ![image-20211219022123281.png](https://oss-club.rt-thread.org/uploads/20211220/b196938657f149ce84d2f14be5ff64eb.png) ELF 头部描述了整个文件的属性,包括,文件是否可执行、目标硬件、目标操作系统、入口点等信息。 .init 定义了一个小函数,叫做 _init,程序的初始化代码会调用它。 .text 为已编译程序的机器代码。 .rodata 为只读数据,比如 printf 语句中格式串。.data 为已初始化的全局和静态 C 变量。 .bss 存放未初始化的全局变量和局部静态变量,以及所有被初始化为 0 的全局或静态变量。不占用实际的空间,只是一个占位符。 .symtab 是一个符号表,存放在程序中定义和引用的函数和全局变量的信息。 .debug 一个调试符号表,内部是程序定义的局部变量和类型定义,程序定义和引用的全局变量,以及原始的 C 源文件。 .line 源程序中的行号和 .text 节中机器指令之间的映射。 .strtab 一个字符串表,内容包括 .symtab 和 .debug 节中的符号表,以及节头部中的节名字。 总体来说,将程序源码编译之后生成的目标文件,主要分成两种段:程序指令和程序数据。代码段属于程序指令,数据段和 .bss 段属于程序数据。 ### 加载可执行程序 可执行程序被加载器加载到内存,即从磁盘内复制可执行文件中的代码和数据到内存中,然后跳转到程序的入口点来运行该程序。将程序复制到内存并运行的过程就叫做**加载**。 在 Linux 系统中,每个程序都有一个运行时的内存映像。 ![image-20211219025125241.png](https://oss-club.rt-thread.org/uploads/20211220/6beb77f08dff62a28f2e8ca490762a27.png) 代码段后边是数段,运行时,堆在数据段之后,通过调用 malloc 库向上增长。 用户栈总是从最大的合法用户地址开始,向较小内存地址增长。 用户栈以上的区域,是为内核中的代码和数据保留的。 程序加载运行时,会创建类似上图所示的内存映像,在程序头部的引导下,加载器将可执行文件复制到代码段和数据段,然后加载器跳转到程序的入口点。 入口点的函数调用启动函数,初始化执行环境,然后调用用户层的 main 函数,处理 main 函数的返回值,并在需要的时候把控制权返回给内核。 main 函数为作为用户可执行程序的入口,是由系统启动函数内部定义的。在环境准备好后,调用 main 函数,开始执行用户程序。 ### 总结 没想到,这么简单的程序背后,涉及到这么多知识内容。 * 源码文件编译成可执行文件具体过程。 * 可执行目标程序加载和执行的详细过程。 * 可执行目标文件内部结构布局。 * 目标文件加载到内存后的布局情况。
4
条评论
默认排序
按发布时间排序
登录
注册新账号
关于作者
zppsky16
公众号【一起学嵌入式】,RTOS、Linux、C/C++
文章
7
回答
5
被采纳
0
关注TA
发私信
相关文章
1
RT-Thread内存和字符串相关函数与C语言自带的内存和字符串相关函数冲突问题
2
嵌入式RT-thread中初始化线程函数中(void *)entry的意义何在
3
cJSON parse 失败,请问怎么解决?
4
请教一个C语言顺序表的问题,不知道有没有大佬帮吗解答
5
小白请教,关于头文件引用,、、哪些场景需要引用它们?
6
使用中断有warn。。。。。。。。。。。
7
局部变量位置被编译器改写
8
RTthread 两个例程结合在一起会出现incompatible type for argument 2 of 'led_matrix_set_color'
9
有没有在单片机编程使用goto语句的?
10
请问如何读取另一个c文件中的温湿度数据啊
推荐文章
1
RT-Thread应用项目汇总
2
玩转RT-Thread系列教程
3
国产MCU移植系列教程汇总,欢迎查看!
4
机器人操作系统 (ROS2) 和 RT-Thread 通信
5
五分钟玩转RT-Thread新社区
6
【技术三千问】之《玩转ART-Pi》,看这篇就够了!干货汇总
7
关于STM32H7开发板上使用SDIO接口驱动SD卡挂载文件系统的问题总结
8
STM32的“GPU”——DMA2D实例详解
9
RT-Thread隐藏的宝藏之completion
10
【ART-PI】RT-Thread 开启RTC 与 Alarm组件
热门标签
RT-Thread Studio
串口
Env
LWIP
SPI
AT
Bootloader
Hardfault
CAN总线
FinSH
ART-Pi
USB
DMA
文件系统
RT-Thread
SCons
RT-Thread Nano
线程
MQTT
STM32
RTC
FAL
rt-smart
ESP8266
I2C_IIC
UART
WIZnet_W5500
ota在线升级
freemodbus
PWM
flash
cubemx
packages_软件包
BSP
潘多拉开发板_Pandora
定时器
ADC
flashDB
GD32
socket
中断
编译报错
Debug
SFUD
rt_mq_消息队列_msg_queue
msh
keil_MDK
ulog
C++_cpp
MicroPython
本月问答贡献
踩姑娘的小蘑菇
4
个答案
1
次被采纳
红枫
4
个答案
1
次被采纳
张世争
4
个答案
1
次被采纳
Ryan_CW
4
个答案
1
次被采纳
xiaorui
1
个答案
1
次被采纳
本月文章贡献
catcatbing
3
篇文章
5
次点赞
qq1078249029
2
篇文章
2
次点赞
xnosky
2
篇文章
1
次点赞
Woshizhapuren
1
篇文章
5
次点赞
YZRD
1
篇文章
2
次点赞
回到
顶部
发布
问题
投诉
建议
回到
底部