Skip to content

Latest commit

 

History

History
163 lines (111 loc) · 8.57 KB

Rucbase-Lab3[查询执行实验文档].md

File metadata and controls

163 lines (111 loc) · 8.57 KB

查询执行文档

Rucbase查询执行模块采用的是火山模型(Volcano Model),你可以通过链接获取相应论文阅读以理解火山模型的基本概念,并结合项目结构文档理解系统查询模块的整体架构和处理流程。

实验一:元数据管理和DDL语句 (25分)

在本实验中,你需要完成src/system/sm_manager.cpp中的接口,使得系统能够支持DDL语句,具体包括create table、drop table、create index和drop index语句。

相关代码位于src/system/sm_manager.hsrc/system/sm_manager.cpp文件中。在src/system/sm_manager.cpp文件中,给出了create_tablecreate_dbdrop_db函数的实现示例,你需要参照这些函数实现剩余的空缺函数。

SmManager类中,你需要实现的函数接口如下:

  • open_db(...):系统通过调用该接口打开数据库

在运行系统时,你需要在命令行中输入一个参数<database name>,代表当前数据库的名称,系统会创建一个同名文件夹,并在文件夹中存储所有数据库相关的数据文件。系统再次启动时,会打开数据库名称的同名文件夹,并通过读取元数据文件获取当前数据库的相关元数据。 同时,系统还需要打开所有的表文件和索引文件,并将文件句柄加载到系统中。

  • close_db(...):系统通过调用该接口关闭数据库

在系统服务端关闭时,系统调用该函数,将元数据信息、表数据等落盘,并关闭相关文件。

  • drop_table(...):删除表

系统调用该函数删除指定名称等表,并删除相关的数据文件,更新元数据信息

  • create_index(...):创建索引

系统调用该函数在指定表的指定属性上创建索引(该函数在lab2中应该已经实现了)

  • drop_index(...):删除索引

系统调用该函数删除指定表的指定索引(该函数在lab2中应该已经实现了)

测试点及分数

在完成本任务后,你需要使用src/test文件夹下的query_unit_test.py单元测试文件来进行basic_query_test1.sql的测试

cd src/test/query
python query_unit_test.py basic_query_test1.sql # 25分
python query_unit_test.py basic_query_test{i}.sql  # replace {i} with the desired test file index

实验二:DML语句实现(75分)

在本实验中,你需要完成src/execution文件夹下执行算子中的空缺函数,使得系统能够支持增删改查四种DML语句。

相关代码位于src/execution文件夹下,其中需要完成的文件包括executor_delete.hexecutor_nestedloop_join.hexecutor_projection.hexecutor_seq_scan.hexecutor_update.h,已经实现的文件包括executor_insert.hexecution_manager.cpp

在本实验中,你需要仿照insert算子实现如下算子:

  • SeqScan算子:你需要实现该算子的Next()beginTuple()nextTuple()接口,用于表的扫描,你需要调用RmScan中的相关函数辅助实现(这些接口在lab1中已经实现);
  • Projection算子:你需要实现该算子的Next()beginTuple()nextTuple()接口,该算子用于投影操作的实现;
  • NestedLoopJoin算子:你需要实现该算子的Next()beginTuple()nextTuple()接口,该算子用于连接操作,在本实验中,你只需要支持两表连接;
  • Delete算子:你需要实现该算子的Next()接口,该算子用于删除操作;
  • Update算子:你需要实现该算子的Next()接口,该算子用于更新操作。

所有算子都继承了抽象算子类execuotr_abstract,它给出了各个算子继承的基类抽象算子的声明和相应方法。

注意⚠️

有些`execuotr_abstract中定义的虚函数在子类中没有添加TODO,但也是需要implement的,否则会导致程序无法正确运行。

连接算子实现提示

多表连接语句的语法如下:

select [col..] from TbName join TbName ... where cond; 

连接算子不能够作为算子树的叶子节点,它的结构中有两个指向左右孩子算子的指针

std::unique_ptr<AbstractExecutor> left_;
std::unique_ptr<AbstractExecutor> right_;

在本系统中,默认规定用的连接方式是连接算子作为右孩子

如,select * from A,B,C,系统生成的算子树如下

//          P (Projection)
//          |
//          L2  (LoopJoin)
//         /  \
//        A    L1
//           /    \
//          B      C  (C table scan)

你需要补充完成LoopJoin算子中的以下3个方法:

void beginTuple() override {}

void nextTuple() override {}

std::unique_ptr<RmRecord> Next() override{}
    

测试点及分数

在完成本实验所有任务后,你需要通过src/test文件夹下的basic_query_test1~basic_query_test5.sql测试。

cd src/test/query
python query_test_basic.py  # 100分

测试说明

本实验通过SQL语句黑盒测试,包括五个测试点,每个测试点测试内容和分数如下:

测试点 测试内容 分数
basic_query_test1 表和索引的创建与删除 25
basic_query_test2 单表插入与条件查询 15
basic_query_test3 单表更新与条件查询 15
basic_query_test4 单表删除与条件查询 15
basic_query_test5 多表连接与条件查询 30

注意⚠️

在本测试中,要求把select语句的输出写入到指定文件中,写入逻辑已经在select_from函数中给出,不要修改写入格式。 对于执行错误的SQL语句,需要打印failure到output.txt文件中。