我们使用USB转TTY下载线连接Starfive旗下的VisionFive2开发板。主机操作系统是Ubuntu22.04,具体配置如下。
引脚连接实物图如下:
-
下载
sudo apt update sudo apt install minicom
-
设置
sudo minicom -s
进入minicom的设置界面后:方向键选择 Serial port setup后按回车确定。
进入串口设置界面后:按Shift+a选择Serial Device,将设备名改为/dev/ttyUSB0.
修改完成后按下回车,返回上级菜单后,选择Save setup as dfl保存配置。
保存后,选择Exit退出Minicom
首先将连接好引脚的USB插口插入笔记本上,然后使用以下命令启动Minicom。
sudo minicom
如果启动失败显示没有/dev/ttyUSB0,请参见下一节《CH340系列串口驱动占用》。
启动后会显示如下的信息:
然后使用电源线连接开发板,给开发板加电。此时Minicom会开始显示加电后各种程序启动的信息:
如果配置好Minicom后显示没有ttyUSB的问题,那么可能是由于CH340系列串口驱动被占用。
使用以下命令判断是否驱动被占用:
sudo dmesg | grep brltty
如果显示以下信息:
[ 7033.078452] usb 1-13: usbfs: interface 0 claimed by ch341 while 'brltty' sets config #1
说明:驱动占用
解决方法:使用以下命令卸载brltty
sudo apt remove brltty
然后重新进行插拔USB接口,并使用以下的命令查看是否恢复正常:
ls /dev/ttyUSB0
若显示:
ls /dev/ttyUSB0
/dev/ttyUSB0
说明恢复正常,可以按照之前的步骤继续实验。
StarFive为VisionFive2提供了一个GitHub仓库,阅读这个仓库中的README文件是本次实验的一部分。从README得知,为连编译能够在开发板上运行的Linux内核,首先需要为编译提供依赖环境。
使用以下的命令,在ubuntu22.04上创建可实现交叉编译risc-v架构的环境依赖:
sudo apt update
sudo apt-get install build-essential automake libtool texinfo bison flex gawk g++ git xxd curl wget gdisk gperf cpio bc screen texinfo unzip libgmp-dev libmpfr-dev libmpc-dev libssl-dev libncurses-dev libglib2.0-dev libpixman-1-dev libyaml-dev patchutils python3-pip zlib1g-dev device-tree-compiler dosfstools mtools kpartx rsync
安装Git LFS:
curl -s https://packagecloud.io/install/repositories/github/git-lfs/script.deb.sh | sudo bash
sudo apt-get install git-lfs
需要注意的是安装Git LFS需要访问外网,要完成此步骤需读者自行解决访问外网的问题或者使用国内镜像网站。
克隆VisionFive2 仓库
使用以下命令克隆VisionFive2:
git clone https://github.com/starfive-tech/VisionFive2.git
cd VisionFive2
git checkout JH7110_VisionFive2_devel
git submodule update --init --recursive
切换分支:
cd buildroot && git checkout --track origin/JH7110_VisionFive2_devel && cd ..
cd u-boot && git checkout --track origin/JH7110_VisionFive2_devel && cd ..
cd linux && git checkout --track origin/JH7110_VisionFive2_devel && cd ..
cd opensbi && git checkout master && cd ..
cd soft_3rdpart && git checkout JH7110_VisionFive2_devel && cd ..
这次实验主要目的是初识RISC—V架构。简单的了解一下RISC-V下的汇编,理解代码在RISC-V下是怎么跑起来的。
我们将会实现一个非常简单的进程调度器,来帮助我们理解操作系统和RISC-V。
如果需要更加详细的了解请参考:
- RISC-V中文参考。
- The RISC-V Instruction Set Manual(Volume I , Volume II)
- ABI for RISC-V
我们这里只是简单的了解一下riscv寄存器的 RISC-V 应用程序二进制接口(ABI)
这些寄存器是riscv的通用寄存器,一共有32个,在这一章我们可能会用到ra寄存器
:保存函数返回地址。sp寄存器
:保存函数的栈指针。
我们都知道,c语言会被转化成汇编在转化成机器码。而汇编和机器码之间的转换是直接转换的。所以我们理解了一个函数在汇编上怎么运行的,那么我们就能理解函数在计算机上是如何运行的。
我们这里使用的是RISC-V的指令架构,所以我们只讲解RISC-V下的汇编代码。但是为了更好的理解,我强烈建议先阅读理解x86下函数是怎么运行的。
首先我们来看在初入计算机世界的时候,我们遇到的第一份代码hello world的反汇编代码。
#include <stdiio.h>
int main(){
printf("hello world");
}
我们编译好之后用objdump反汇编一下,我这里去除掉了一些不需要的信息,只保留main函数的部分。
hello: file format elf64-littleriscv
Disassembly of section .text:
000000000000062a <main>:
62a: 1141 addi sp,sp,-16
62c: e406 sd ra,8(sp)
62e: e022 sd s0,0(sp)
630: 0800 addi s0,sp,16
632: 00000517 auipc a0,0x0
636: 07650513 addi a0,a0,118 # 6a8 <__libc_csu_fini+0x6>
63a: f17ff0ef jal ra,550 <printf@plt>
63e: 4781 li a5,0
640: 853e mv a0,a5
642: 60a2 ld ra,8(sp)
644: 6402 ld s0,0(sp)
646: 0141 addi sp,sp,16
648: 8082 ret
我们来分析一下这段代码:
首先addi sp,sp,-16
的作用是开栈(这里假定对函数栈有一定的了解,如果不了解请阅读上文的c语言函数调用栈
),为函数开辟自己的栈帧。
然后是sd ra,8(sp)
和sd s0,0(sp)
这是将ra和s0分别存储在sp+8和sp+0的位置。这个里这个ra是函数的返回地址(调用者调用此函数的下一条指令)当函数执行完后,此函数的调用者时就是跳转到ra中存储的位置,如果此函数时最末端的叶子调用,是不用将其存入栈里面的。s0是函数的栈的栈底,也就是帧指针。
接下来是函数内部的一些计算跳转,我们先不管。
直接看到下面的642位置 ld ra,8(sp)
和644ld s0.0(sp)
这两个指令是把函数在开始存储的返回地址和帧指针重新加载进相应的寄存器
然后是addi sp,sp,-16
收回栈帧。
最后ret,这个ret是个伪指令,实际上是jar ra
那么我们就可以大概了解函数是怎么运行的了:
1.首先为函数开辟栈帧
2.接着存储返回地址和上个栈帧的基址
3.运算
4.将存储的返回地址和帧地址重新加载进相应的寄存器
5.收回栈帧
6.返回上个函数调用此函数的位置的下一条指令。
有了以上信息后,理论上我们已经可以手写汇编了,那么我们来完成一下我们的内容:编写一个简单的调度器。
首先制定我们的需求:
- 可以进行进程切换
- 简单
那么一个进程里面会有什么呢--pc寄存器加上通用寄存器,加上函数的栈帧。我们一般称之为函数现场。当现场没变,那么程序的状态就没变。也就是说当我们保存了现场,然后切换到其他进程运行一段时间后,恢复它那么我们就能切换回来,继续运行。那么我们就可以定义一个时间片段,允许每个进程运行一段时间然后切换到其他进程。这样我们就能做到根据时间片的多个进程的轮转调度了。
但是riscv的通用寄存器有32个,很多,我们其实是不需要全部保存的,只需要保存caller save的寄存器。但是对此时的我们来说还是有点多,我们可以再精简一点,省去我们不需要的寄存器,比如有关浮点数的寄存器我们这里是用不到的。
首先我们得有一个存储现场的地方,我们将现场存储在pcb的AThread里面,每次切换出去的时候把它保存进来,切换回来的时候,从这里把寄存器重新加载进去。
注意这里的__switch函数,在这里我们写了两部分的汇编代码。第一部分就是是将当前的各种寄存器存入内存,第二部分就是将内存中存储的值加载进寄存器。但是函数入口会改变栈,所以在存储之前我们先要将函数入口给回退。
这部分的代码逻辑就很清晰了,定时器中断里面的值达到我们期望的值的时候进行一次进程切换。
mypcb.h
/*
* linux/mykernel/mypcb.h
*
* Kernel internal PCB types
*
* Copyright (C) 2023 WangRui
*
*/
#define MAX_TASK_NUM 4
#define KERNEL_STACK_SIZE 1024*2
/* CPU-specific state of this task */
//初始状态
typedef struct Thread {
unsigned long s0;
unsigned long ip;
unsigned long sp;
}tThread;
//保存的现场
typedef struct AThread {
//unsigned long s0;
unsigned long ra;
unsigned long sp;
unsigned long s0;
unsigned long s1;
unsigned long s2;
unsigned long s3;
unsigned long s4;
unsigned long s5;
unsigned long s6;
unsigned long s7;
unsigned long s8;
unsigned long s9;
unsigned long s10;
unsigned long s11;
}aThread;
typedef struct PCB{
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
unsigned long stack[KERNEL_STACK_SIZE];//在这里存储进程的整个栈。
/* CPU-specific state of this task */
struct Thread thread;
unsigned long task_entry;
struct PCB *next;
}tPCB;
void my_schedule(void);
这部分代码主要是一些数据结构的定义,我们把一个进程的状态抽象成一个pcb块,在这里我们存入最主要的几个数据:
- pid:进程的进程号,是一个标识符,它是唯一的。
- state: 用来表示进程当前的状态。如果是runnaable的话就可以被进程调度器发现,并且参与调度。
- stack: 程序运行时所使用的栈空间,每个程序的栈空间时不一样的。
- thread:用来保存程序运行时的寄存器状态,即现场。
- tash_entry: 用来表示程序的入口地址,简单理解相当于我们平时编程的main函数。
- next: 表示下一个程序的地址。
/*
* linux/mykernel/myinterrupt.c
*
* Kernel internal my_timer_handler
*
* Copyright (C) 2023, 2023 WangRui
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
extern tPCB task[MAX_TASK_NUM];
extern tPCB * my_current_task;
extern volatile int my_need_sched;
volatile int time_count = 0;
/*
* Called by timer interrupt.
* it runs in the name of current running process,
* so it use kernel stack of current running process
*/
//我们的定时器
void my_timer_handler(void)
{
if(time_count%1000 == 0 && my_need_sched != 1)
{
printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
my_need_sched = 1;
}
time_count ++ ;
return;
}
void __switch(aThread * old,aThread *new){
//old a0 new a1
asm volatile (
"add s0,sp,-16\n"
"ld s0,8(sp)\n"
"add sp,sp,16\n"
"sd ra,0(%[old]) \n"
"sd sp,8(%[old]) \n"
"sd s0,16(%[old]) \n"
"sd s1,24(%[old]) \n"
"sd s2,32(%[old]) \n"
"sd s3,40(%[old]) \n"
"sd s4,48(%[old]) \n"
"sd s5,56(%[old]) \n"
"sd s6,64(%[old]) \n"
"sd s7,72(%[old]) \n"
"sd s8,80(%[old]) \n"
"sd s9,88(%[old]) \n"
"sd s10,96(%[old]) \n"
"sd s11,104(%[old]) \n"
"ld ra, 0(%[new]) \n"
"ld sp, 8(%[new]) \n"
"ld s0, 16(%[new]) \n"
"ld s1, 24(%[new]) \n"
"ld s2, 32(%[new]) \n"
"ld s3, 40(%[new]) \n"
"ld s4, 48(%[new]) \n"
"ld s5, 56(%[new]) \n"
"ld s6, 64(%[new]) \n"
"ld s7, 72(%[new]) \n"
"ld s8, 80(%[new]) \n"
"ld s9, 88(%[new]) \n"
"ld s10, 96(%[new]) \n"
"ld s11, 104(%[new]) \n"
"ret \n"
:
: [old] "r" (old),[new] "r" (new)
);
}
//调度器
void my_schedule(void)
{
tPCB * next;
tPCB * prev;
if(my_current_task == 0
|| my_current_task->next == 0)
{
return;
}
print(">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
{
my_current_task = next;
print("stacks : %p\n",task->context.sp);
print(">>>switch %d to %d<<<\n",prev->pid,next->pid);
__switch(&prev->context, &next->context);
print("after scheduler\n");
}
return;
}
这里的my_time_handler
函数时一个定时器中断所调用的函数,每当计算机产生一次定时器中断,就会调用这个函数。这个函数的作用是当触发了一定的定时器中断之后,就开启调度器。有了这个我们就能让我们的程序按时间片进行轮转运行了。
而这里的my_schdule
就是我们的调度器,他最主要的是__switch
函数这个函数会将此时运行的程序的寄存器保存进prev结构体里面,然后将下一个进程的寄存器状态从next结构体里面取出来,并且加载进寄存器。
/*
* linux/mykernel/mymain.c
*
* Kernel internal my_timer_handler
*
* Copyright (C) 2023, 2023 WangRui
*
*/
#include <linux/types.h>
#include <linux/string.h>
#include <linux/ctype.h>
#include <linux/tty.h>
#include <linux/vmalloc.h>
#include "mypcb.h"
tPCB task[MAX_TASK_NUM];
tPCB * my_current_task = NULL;
volatile int my_need_sched = 0;
void my_process(void);
void __init_my_start_kernel(void)
{
print("run init my start kernel");
int pid = 0;
int i;
/* Initialize process 0*/
//unsigned long stacks = 0xffffffff81601000;
task[pid].pid = pid;
task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].thread.s0 = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].next = &task[pid];
task[pid].context.ra = (unsigned long)my_process;
task[pid].context.s0 = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
task[pid].context.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
/*fork more process */
for(i=1;i<MAX_TASK_NUM;i++)
{
memcpy(&task[i],&task[0],sizeof(tPCB));
task[i].pid = i;
task[i].thread.sp = (unsigned long)(&task[i].stack[KERNEL_STACK_SIZE-1]);
task[i].context.s0 = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].context.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE-1];
task[i].next = task[i-1].next;
task[i-1].next = &task[i];
}
print("stacks : %p\n",task[0].thread.sp);
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
__asm__ volatile(
"mv sp,%[msp]\n"
"mv ra,%[mip]\n"
"mv s0,%[ms0]\n"
"ret\n\t" /* pop task[pid].thread.ip to rip */
:
:[mip] "r" (task[pid].thread.ip),[msp] "r" (task[pid].thread.sp), [ms0]"r" (task[pid].thread.s0) /* input c or d mean %ecx/%edx*/
);
}
int i = 0;
void my_process(void)
{
while(1)
{
i++;
if(i%10000000 == 0)
{
printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
if(my_need_sched == 1)
{
my_need_sched = 0;
my_schedule();
}
printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
}
}
}
这里的my_kernel_start
函数主要是进行一些初始化,其实主要就是初始化进程运行的栈空间,和entry的地址,这里的汇编代码的作用是将第一个程序的entry地址填入ra之中,而我们都知道ra是保存的是函数返回之后,下一条指令运行的地址,所以我们在这里将entry直接加载进ra然后跳转到这个地址,这样我们就能改变函数的运行顺序,从而进入我们自己写的程序里面。
Makefile:
obj-y = mymain.o myinterrupt.o
kernel.patch:
diff --color -Naru Linux/drivers/clocksource/timer-riscv.c linux/drivers/clocksource/timer-riscv.c
--- Linux/drivers/clocksource/timer-riscv.c 2023-10-25 19:29:12.000000000 +0800
+++ linux/drivers/clocksource/timer-riscv.c 2023-10-29 16:10:34.294399984 +0800
@@ -20,6 +20,8 @@
#include <asm/smp.h>
#include <asm/sbi.h>
#include <asm/timex.h>
+//change
+#include "linux/timer.h"
static int riscv_clock_next_event(unsigned long delta,
struct clock_event_device *ce)
@@ -86,7 +88,7 @@
csr_clear(CSR_IE, IE_TIE);
evdev->event_handler(evdev);
-
+ my_timer_handler();
return IRQ_HANDLED;
}
diff --color -Naru Linux/include/linux/start_kernel.h linux/include/linux/start_kernel.h
--- Linux/include/linux/start_kernel.h 2023-10-25 19:29:16.000000000 +0800
+++ linux/include/linux/start_kernel.h 2023-10-29 16:16:36.018535237 +0800
@@ -7,7 +7,8 @@
/* Define the prototype for start_kernel here, rather than cluttering
up something else. */
-
+//change
+extern void __init my_start_kernel(void);
extern asmlinkage void __init start_kernel(void);
extern void __init arch_call_rest_init(void);
extern void __ref rest_init(void);
diff --color -Naru Linux/include/linux/timer.h linux/include/linux/timer.h
--- Linux/include/linux/timer.h 2023-10-25 19:29:16.000000000 +0800
+++ linux/include/linux/timer.h 2023-10-29 16:19:31.419156143 +0800
@@ -191,7 +191,8 @@
#endif
#define del_singleshot_timer_sync(t) del_timer_sync(t)
-
+//change
+extern void my_timer_handler(void);
extern void init_timers(void);
struct hrtimer;
extern enum hrtimer_restart it_real_fn(struct hrtimer *);
diff --color -Naru Linux/init/main.c linux/init/main.c
--- Linux/init/main.c 2023-10-25 19:29:16.000000000 +0800
+++ linux/init/main.c 2023-10-29 16:22:14.563230772 +0800
@@ -1137,7 +1137,8 @@
acpi_subsystem_init();
arch_post_acpi_subsys_init();
kcsan_init();
-
+ //change
+ my_start_kernel();
/* Do the rest non-__init'ed, we're now alive */
arch_call_rest_init();
diff --color -Naru Linux/Makefile linux/Makefile
--- Linux/Makefile 2023-10-25 19:29:11.000000000 +0800
+++ linux/Makefile 2023-10-29 16:24:49.013860022 +0800
@@ -1115,7 +1115,9 @@
export MODULES_NSDEPS := $(extmod_prefix)modules.nsdeps
ifeq ($(KBUILD_EXTMOD),)
-core-y += kernel/ certs/ mm/ fs/ ipc/ security/ crypto/ block/
+#core-y += kernel/ certs/ mm/ fs/ ipc/ security/ crypto/ block/
+#change
+core-y += kernel/ certs/ mm/ fs/ ipc/ security/ crypto/ block/ mykernel/
vmlinux-dirs := $(patsubst %/,%,$(filter %/, \
$(core-y) $(core-m) $(drivers-y) $(drivers-m) \
diff --color -Naru Linux/mykernel/Makefile linux/mykernel/Makefile
--- Linux/mykernel/Makefile 1970-01-01 08:00:00.000000000 +0800
+++ linux/mykernel/Makefile 2023-10-29 16:05:02.543702121 +0800
@@ -0,0 +1 @@
+obj-y = mymain.o myinterrupt.o
diff --color -Naru Linux/mykernel/myinterrupt.c linux/mykernel/myinterrupt.c
--- Linux/mykernel/myinterrupt.c 1970-01-01 08:00:00.000000000 +0800
+++ linux/mykernel/myinterrupt.c 2023-10-29 17:58:31.532334640 +0800
@@ -0,0 +1,86 @@
+/*
+ * linux/mykernel/myinterrupt.c
+ *
+ * Kernel internal my_timer_handler
+ * Change IA32 to x86-64 arch, 2020/4/26
+ *
+ * Copyright (C) 2013, 2020 Mengning
+ *
+ */
+#include <linux/types.h>
+#include <linux/string.h>
+#include <linux/ctype.h>
+#include <linux/tty.h>
+#include <linux/vmalloc.h>
+
+#include "mypcb.h"
+
+extern tPCB task[MAX_TASK_NUM];
+extern tPCB * my_current_task;
+extern volatile int my_need_sched;
+volatile int time_count = 0;
+
+/*
+ * Called by timer interrupt.
+ * it runs in the name of current running process,
+ * so it use kernel stack of current running process
+ */
+void my_timer_handler(void)
+{
+ if(time_count%1000 == 0 && my_need_sched != 1)
+ {
+ printk(KERN_NOTICE ">>>my_timer_handler here<<<\n");
+ my_need_sched = 1;
+ }
+ time_count ++ ;
+ return;
+}
+
+void my_schedule(void)
+{
+ tPCB * next;
+ tPCB * prev;
+
+ if(my_current_task == NULL
+ || my_current_task->next == NULL)
+ {
+ return;
+ }
+ printk(KERN_NOTICE ">>>my_schedule<<<\n");
+ /* schedule */
+ next = my_current_task->next;
+ prev = my_current_task;
+ if(next->state == 0)/* -1 unrunnable, 0 runnable, >0 stopped */
+ {
+ my_current_task = next;
+ unsigned long prev_sp = prev->thread.sp;
+ unsigned long prev_ra = next->thread.ra;
+ unsigned long next_sp = next->thread.sp;
+ unsigned long next_ra = next->thread.ra;
+ printk(KERN_NOTICE ">>>switch %d to %d<<<\n",prev->pid,next->pid);
+ /* switch to next process */
+ // __asm__ volatile(
+ // "mv %0,sp \n"
+ // "mv %1,ra \n"
+ // "ld sp,%2 \n"
+ // "ld ra,%3 \n"
+ // "ret"
+ // : "=r" (prev->thread.sp),"=r" (prev->thread.ra)
+ // : "m" (next->thread.sp), "m" ( next->thread.ra)
+ // );
+ __asm__ volatile (
+ "mv %0,sp \n"
+ "mv %1,ra \n"
+ :"=r" (prev_sp) ,"=r" (prev_ra)
+ );
+ __asm__ volatile(
+
+ "mv sp,%0 \n"
+ "mv ra,%1 \n"
+ "ret"
+ :
+ : "r" (next_sp), "r" ( next_ra)
+ );
+ }
+ return;
+}
diff --color -Naru Linux/mykernel/mymain.c linux/mykernel/mymain.c
--- Linux/mykernel/mymain.c 1970-01-01 08:00:00.000000000 +0800
+++ linux/mykernel/mymain.c 2023-10-29 14:51:20.000000000 +0800
@@ -0,0 +1,75 @@
+/*
+ * linux/mykernel/mymain.c
+ *
+ * Kernel internal my_start_kernel
+ * Change IA32 to x86-64 arch, 2020/4/26
+ *
+ * Copyright (C) 2013, 2020 Mengning
+ *
+ */
+#include <linux/types.h>
+#include <linux/string.h>
+#include <linux/ctype.h>
+#include <linux/tty.h>
+#include <linux/vmalloc.h>
+
+
+#include "mypcb.h"
+
+tPCB task[MAX_TASK_NUM];
+tPCB * my_current_task = NULL;
+volatile int my_need_sched = 0;
+
+void my_process(void);
+
+
+void __init my_start_kernel(void)
+{
+ int pid = 0;
+ int i;
+ /* Initialize process 0*/
+ task[pid].pid = pid;
+ task[pid].state = 0;/* -1 unrunnable, 0 runnable, >0 stopped */
+ task[pid].task_entry = task[pid].thread.ra = (unsigned long)my_process;
+ task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE-1];
+ task[pid].next = &task[pid];
+ /*fork more process */
+ for(i=1;i<MAX_TASK_NUM;i++)
+ {
+ memcpy(&task[i],&task[0],sizeof(tPCB));
+ task[i].pid = i;
+ task[i].thread.sp = (unsigned long)(&task[i].stack[KERNEL_STACK_SIZE-1]);
+ task[i].next = task[i-1].next;
+ task[i-1].next = &task[i];
+ }
+ /* start process 0 by task[0] */
+ pid = 0;
+ my_current_task = &task[pid];
+ __asm__ volatile(
+ "mv sp,%[sp]\n"
+ "mv ra,%[ra]\n"
+ "ret"
+ :
+ : [ra] "r" (task[pid].thread.ra),[sp] "r" (task[pid].thread.sp) /* input c or d mean %ecx/%edx*/
+ );
+}
+
+int i = 0;
+
+void my_process(void)
+{
+ while(1)
+ {
+ i++;
+ if(i%10000000 == 0)
+ {
+ printk(KERN_NOTICE "this is process %d -\n",my_current_task->pid);
+ if(my_need_sched == 1)
+ {
+ my_need_sched = 0;
+ my_schedule();
+ }
+ printk(KERN_NOTICE "this is process %d +\n",my_current_task->pid);
+ }
+ }
+}
diff --color -Naru Linux/mykernel/mypcb.h linux/mykernel/mypcb.h
--- Linux/mykernel/mypcb.h 1970-01-01 08:00:00.000000000 +0800
+++ linux/mykernel/mypcb.h 2023-10-29 14:51:27.000000000 +0800
@@ -0,0 +1,29 @@
+/*
+ * linux/mykernel/mypcb.h
+ *
+ * Kernel internal PCB types
+ *
+ * Copyright (C) 2013 Mengning
+ *
+ */
+
+#define MAX_TASK_NUM 4
+#define KERNEL_STACK_SIZE 1024*2
+/* CPU-specific state of this task */
+struct Thread {
+ unsigned long ra;
+ unsigned long sp;
+};
+
+typedef struct PCB{
+ int pid;
+ volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
+ unsigned long stack[KERNEL_STACK_SIZE];
+ /* CPU-specific state of this task */
+ struct Thread thread;
+ unsigned long task_entry;
+ struct PCB *next;
+}tPCB;
+
+void my_schedule(void);
+
todo稍微解释一下汇编代码和C代码以及原理:
patch -p1 < ../kernel.patch
将上一节生成的linux内核目录替换VisionFive2中的linux内核目录后,使用以下命令进行编译。
make -j$(nproc)
此次编译时间较长,编译成功后会在VisionFive2中自动创建work目录,所有的编译完成的文件都会在这个目录中生成。成功编译后,文件结构如图所示:
work/
├── visionfive2_fw_payload.img
├── image.fit
├── initramfs.cpio.gz
├── u-boot-spl.bin.normal.out
├── linux/arch/riscv/boot
├── dts
│ └── starfive
│ ├── jh7110-visionfive-v2-ac108.dtb
│ ├── jh7110-visionfive-v2.dtb
│ ├── jh7110-visionfive-v2-wm8960.dtb
│ ├── vf2-overlay
│ │ └── vf2-overlay-uart3-i2c.dtbo
└── Image.gz
使用以下命令安装TFTP服务器:
sudo apt-get install tftpd-hpa
查看 /etc/default/tftpd-hpa文件:
sudo apt install vim
sudo vim /etc/default/tftpd-hpa
文件内容如下图所示:
明确tftp服务器的文件路径在"/srv/tftp", 将上一节生成的work目录下的所有文件拷贝到/srv/tftp路径中。
Uboot 加载MyKernel 内核和根文件系统有两种方法加载。一种是以网络的形式,利用 tftp 协议和 uboot 命令直接将MyKernel 内核和根文件系统加载到内存中,然后手动引导启动。另一种是通过烧录镜像到TF卡的方式。
首先讲解第一种方式:
按照《使用Minicom连接VisionFive2》节中的步骤,连接 VisionFive2 和 Ubuntu 主机,待开发板成功引导 Uboot 后,使用下面的步骤进行配置。
-
配置TFTP服务
使用网线连接 VisionFive2 开发板后,通过路由器网管查看 Ubuntu 和 VisionFive2 开发板的 IP 地址。并使用以下的命令设置 TFTP 服务器的
setenv serverip 192.168.1.101; setenv ipaddr 192.168.1.28; setenv getewayip 192.168.1.1;
-
在 Uboot中下载
image.fit
文件, 下载速度取决于局域网的带宽,请耐心等待:tftpboot ${loadaddr} image.fit;
-
使用以下命令手动引导内核和根文件系统:
bootm start ${loadaddr}; bootm loados ${loadaddr}; run chipa_set_linux; run cpu_vol_set; booti ${kernel_addr_r} ${ramdisk_addr_r}:${filesize} ${fdt_addr_r};
第二种方式相较于第一种方式,几乎不需要在开发板上有任何命令输入。
首先需要准备一张 TF 卡和读卡器,在 VisionFive2
目录中的使用以下命令生成SD 卡 Image 文件:
sudo make -j$(nproc)
sudo make buildroot_rootfs -j$(nproc)
sudo make img
运行完成之后,将在 work
目录下产生 sdcard.img
文件。
使用 BalenaEtcher将work 目录中的生成的 sdcard.img
文件烧录至 TF 卡中后, 即可在开发板实现 MyKernel 内核和根文件系统的加载。
MyKernel内核加载后将在开发板上实现一个简单的时间片轮转多道程序,如图下所示:
注意根据内核版本不同,我们的程序存在无法正确运行的可能,由于并未完全阅读过linux内核代码,这里可能存在一些我们所不知道的检查。所以在我们使用自己的栈的时候,可能会出现栈溢出的情况。所以我们这里提供另一种实验方法--协程。
协程。协程又被叫做轻量级线程,它与线程很像,协程的切换的方式是和线程切换一模一样的,只不过协程的切换是在用户态下面进行的,并不是内核态。而协程的切换也不会导致内核线程的切换。协程可以为程序带来巨大的性能提升,而且它切换的资源非常少
讲回我们自己的程序,我们会发现,其实我们自己在内核态写的多道程序轮转调用实际上完全可以放在用户态用协程来运行,甚至不需要修改代码。只需要组合起来,然后写个main函数,然后编译运行就行了。
#include <stdio.h>
#include <string.h>
#define MAX_TASK_NUM 4
#define KERNEL_STACK_SIZE 256
/* CPU-specific state of this task */
typedef struct Thread {
unsigned long s0;
unsigned long ip;
unsigned long sp;
} tThread;
typedef struct AThread {
// unsigned long s0;
unsigned long ra;
unsigned long sp;
unsigned long s0;
unsigned long s1;
unsigned long s2;
unsigned long s3;
unsigned long s4;
unsigned long s5;
unsigned long s6;
unsigned long s7;
unsigned long s8;
unsigned long s9;
unsigned long s10;
unsigned long s11;
} aThread;
typedef struct PCB {
int pid;
volatile long state; /* -1 unrunnable, 0 runnable, >0 stopped */
unsigned long stack[KERNEL_STACK_SIZE];
/* CPU-specific state of this task */
struct Thread thread;
struct AThread context;
unsigned long task_entry;
struct PCB *next;
} tPCB;
tPCB task[MAX_TASK_NUM];
tPCB *my_current_task = 0;
volatile int my_need_sched = 0;
void my_process(void);
void my_schedule(void);
extern void __switch(aThread *old, aThread *new);
void __init_my_start_kernel(void) {
printf("run init my start kernel");
int pid = 0;
int i;
/* Initialize process 0*/
// unsigned long stacks = 0xffffffff81601000;
task[pid].pid = pid;
task[pid].state = 0; /* -1 unrunnable, 0 runnable, >0 stopped */
task[pid].task_entry = task[pid].thread.ip = (unsigned long)my_process;
task[pid].thread.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE - 1];
task[pid].thread.s0 = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE - 1];
task[pid].next = &task[pid];
task[pid].context.ra = (unsigned long)my_process;
task[pid].context.s0 = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE - 1];
task[pid].context.sp = (unsigned long)&task[pid].stack[KERNEL_STACK_SIZE - 1];
/*fork more process */
for (i = 1; i < MAX_TASK_NUM; i++) {
memcpy(&task[i], &task[0], sizeof(tPCB));
task[i].pid = i;
task[i].thread.sp = (unsigned long)(&task[i].stack[KERNEL_STACK_SIZE - 1]);
task[i].context.s0 = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE - 1];
task[i].context.sp = (unsigned long)&task[i].stack[KERNEL_STACK_SIZE - 1];
task[i].next = task[i - 1].next;
task[i - 1].next = &task[i];
}
printf("stacks : %p\n", task[0].thread.sp);
/* start process 0 by task[0] */
pid = 0;
my_current_task = &task[pid];
__asm__ volatile(
"mv sp,%[msp]\n"
"mv ra,%[mip]\n"
"mv s0,%[ms0]\n"
"ret\n\t" /* pop task[pid].thread.ip to rip */
:
: [mip] "r"(task[pid].thread.ip), [msp] "r"(task[pid].thread.sp),
[ms0] "r"(task[pid].thread.s0) /* input c or d mean %ecx/%edx*/
);
}
static int i = 0;
void my_process(void) {
while (1) {
i++;
if (i % 10000000 == 0) {
printf("this is process %d -\n", my_current_task->pid);
if (my_need_sched == 0) {
my_need_sched = 0;
my_schedule();
}
printf("this is process %d +\n", my_current_task->pid);
}
}
}
void my_schedule(void) {
tPCB *next;
tPCB *prev;
if (my_current_task == 0 || my_current_task->next == 0) {
return;
}
printf(">>>my_schedule<<<\n");
/* schedule */
next = my_current_task->next;
prev = my_current_task;
if (next->state == 0) /* -1 unrunnable, 0 runnable, >0 stopped */
{
my_current_task = next;
printf(">>>switch %d to %d<<<\n", prev->pid, next->pid);
__switch(&prev->context, &next->context);
printf("after scheduler\n");
}
return;
}
int main() {
printf("hello world\n");
__init_my_start_kernel();
}
.global __switch
__switch:
sd ra,0(a0)
sd sp,8(a0)
sd s0,16(a0)
sd s1,24(a0)
sd s2,32(a0)
sd s3,40(a0)
sd s4,48(a0)
sd s5,56(a0)
sd s6,64(a0)
sd s7,72(a0)
sd s8,80(a0)
sd s9,88(a0)
sd s10,96(a0)
sd s11,104(a0)
ld ra, 0(a1)
ld sp, 8(a1)
ld s0, 16(a1)
ld s1, 24(a1)
ld s2, 32(a1)
ld s3, 40(a1)
ld s4, 48(a1)
ld s5, 56(a1)
ld s6, 64(a1)
ld s7, 72(a1)
ld s8, 80(a1)
ld s9, 88(a1)
ld s10, 96(a1)
ld s11, 104(a1)
ret
mymain:mymain.c
riscv64-linux-gnu-gcc -c ./mymain.c -o mymain.o
switch:switch.s
riscv64-linux-gnu-gcc -c ./switch.s -o switch.o
all: mymain switch
riscv64-linux-gnu-gcc ./mymain.o ./switch.o -o ./main
将代码准备好之后,我们只需要make all就可以在本目录下生成一个名为main
的二进制文件,让我们来运行它,发现和我们想得一模一样。非常好!现在我们已经能理解线程是怎么切换的了。