- 查询执行文档
Rucbase查询执行模块采用的是火山模型(Volcano Model),你可以通过链接获取相应论文阅读以理解火山模型的基本概念,并结合项目结构文档理解系统查询模块的整体架构和处理流程。
在本实验中,你需要完成src/system/sm_manager.cpp中的接口,使得系统能够支持DDL语句,具体包括create table、drop table、create index和drop index语句。
相关代码位于src/system/sm_manager.h
和src/system/sm_manager.cpp
文件中。在src/system/sm_manager.cpp
文件中,给出了create_table
、create_db
和drop_db
函数的实现示例,你需要参照这些函数实现剩余的空缺函数。
在SmManager
类中,你需要实现的函数接口如下:
open_db(...)
:系统通过调用该接口打开数据库
在运行系统时,你需要在命令行中输入一个参数<database name>,代表当前数据库的名称,系统会创建一个同名文件夹,并在文件夹中存储所有数据库相关的数据文件。系统再次启动时,会打开数据库名称的同名文件夹,并通过读取元数据文件获取当前数据库的相关元数据。 同时,系统还需要打开所有的表文件和索引文件,并将文件句柄加载到系统中。
close_db(...)
:系统通过调用该接口关闭数据库
在系统服务端关闭时,系统调用该函数,将元数据信息、表数据等落盘,并关闭相关文件。
drop_table(...)
:删除表
系统调用该函数删除指定名称等表,并删除相关的数据文件,更新元数据信息
create_index(...)
:创建索引
系统调用该函数在指定表的指定属性上创建索引(该函数在lab2中应该已经实现了)
drop_index(...)
:删除索引
系统调用该函数删除指定表的指定索引(该函数在lab2中应该已经实现了)
在完成本任务后,你需要使用src/test文件夹下的query_unit_test.py单元测试文件来进行basic_query_test1.sql的测试
cd src/test/query
python query_unit_test.py basic_query_test1.sql # 25分
python query_unit_test.py basic_query_test{i}.sql # replace {i} with the desired test file index
在本实验中,你需要完成src/execution文件夹下执行算子中的空缺函数,使得系统能够支持增删改查四种DML语句。
相关代码位于src/execution
文件夹下,其中需要完成的文件包括executor_delete.h
、executor_nestedloop_join.h
、executor_projection.h
、executor_seq_scan.h
、executor_update.h
,已经实现的文件包括executor_insert.h
和execution_manager.cpp
。
在本实验中,你需要仿照insert算子实现如下算子:
SeqScan
算子:你需要实现该算子的Next()
、beginTuple()
和nextTuple()
接口,用于表的扫描,你需要调用RmScan
中的相关函数辅助实现(这些接口在lab1中已经实现);Projection
算子:你需要实现该算子的Next()
、beginTuple()
和nextTuple()
接口,该算子用于投影操作的实现;NestedLoopJoin
算子:你需要实现该算子的Next()
、beginTuple()
和nextTuple()
接口,该算子用于连接操作,在本实验中,你只需要支持两表连接;Delete
算子:你需要实现该算子的Next()
接口,该算子用于删除操作;Update
算子:你需要实现该算子的Next()
接口,该算子用于更新操作。
所有算子都继承了抽象算子类execuotr_abstract
,它给出了各个算子继承的基类抽象算子的声明和相应方法。
注意
有些`execuotr_abstract中定义的虚函数在子类中没有添加TODO,但也是需要implement的,否则会导致程序无法正确运行。
多表连接语句的语法如下:
select [col..] from TbName join TbName ... where cond;
连接算子不能够作为算子树的叶子节点,它的结构中有两个指向左右孩子算子的指针
std::unique_ptr<AbstractExecutor> left_;
std::unique_ptr<AbstractExecutor> right_;
在本系统中,默认规定用的连接方式是连接算子作为右孩子
如,select * from A,B,C
,系统生成的算子树如下
// P (Projection)
// |
// L2 (LoopJoin)
// / \
// A L1
// / \
// B C (C table scan)
你需要补充完成LoopJoin
算子中的以下3个方法:
void beginTuple() override {}
void nextTuple() override {}
std::unique_ptr<RmRecord> Next() override{}
在完成本实验所有任务后,你需要通过src/test文件夹下的basic_query_test1~basic_query_test5.sql测试。
cd src/test/query
python query_test_basic.py # 100分
本实验通过SQL语句黑盒测试,包括五个测试点,每个测试点测试内容和分数如下:
测试点 | 测试内容 | 分数 |
---|---|---|
basic_query_test1 |
表和索引的创建与删除 | 25 |
basic_query_test2 |
单表插入与条件查询 | 15 |
basic_query_test3 |
单表更新与条件查询 | 15 |
basic_query_test4 |
单表删除与条件查询 | 15 |
basic_query_test5 |
多表连接与条件查询 | 30 |
注意
在本测试中,要求把select语句的输出写入到指定文件中,写入逻辑已经在select_from函数中给出,不要修改写入格式。 对于执行错误的SQL语句,需要打印failure到output.txt文件中。