[OSPP] 开源之夏 proposal

前言

大家可以在此按章节, 每个 proposal 一个单独的说明, 内容和大体格式参考官方PDF说明例如:

描述：目前 hugegraph 社区没有提供 spark/flink connector 连接器，缺乏大数据的流/批处理能力，connector 能增加 hugegraph 在大数据处理场景的适用性，更好地与大数据生态集成。
产出标准：
1. 实现 hugegraph spark writer，支持 hugegrpah 点边属性的数据写入。
2. 实现 hugegraph flink writer，支持 hugegrpah 点边属性的数据写入。
3. 完成使用文档撰写。
4. 完成相关UT和CI。
技术要求：熟悉Spark/Flink/hugegraph，具备java和scala研发能力。

发起人: @simon824 (重要紧急)

描述：目前 hugegraph-computer 每次启动一个算法任务将会在 k8s 启动一个 master 节点和多个 worker 节点并将 hugegraph-server 中的图数据进行分片并加载到各 worker 节点上，然后开始并行计算，这个数据分片和加载的流程是非常耗时的，当对同一个图执行不用算法任务时需要再走一遍数据分片加载流程，我们可以将 vertex/edge 生成 snapshot 保存起来，在执行其他算法时 worker 可以直接加载 snapshot 来实现一次加载多次执行，这将大大的提高 computer 的执行效率。
产出标准：
1. 实现 vertex/edge 生成 snapshot 保存到 k8s的 Persistent Volume 并将图的 metadata 保存到 etcd 中。
2. 使 computer 支持直接加载 vertex/edge 的 snapshot 从 k8s的 Persistent Volume 中，并跳过数据分片和从 hugegraph-server 中拉取数据的过程。
3. 完成 k8s operator 和 API 的相关适配。
4. 完成相关UT和CI。
技术要求：熟悉分布式计算（图计算更佳）和k8s相关理论知识，具备java研发能力。

发起人: @coderzc (重要不紧急)

发起人: @javeme (重要不紧急, 难度较高, 工作量大)

研发需要多久

需求度? 不同语言 discussion 投票 (必要不紧急)

PS: python client 已经在路上

Documentation license here.