科学书海是一个基于书生·浦语工具链开发的项目,旨在利用高质量图书数据微调LLM(大型语言模型),为读者提供个性化的图书推荐、书单规划、知识问答和学习指引等服务。
- 利用LLM的智慧能力,帮助读者更有效地探索科学书籍的海洋。
- 提供个性化的阅读体验,满足不同读者的学习和阅读需求。
- 提供学习指导,帮助读者拥有更高效的学习体验。
- 图书推荐:根据读者的兴趣、阅读历史、搜书意向,推荐最符合其当下需求的科学图书。
- 书单规划:帮助读者规划阅读计划,提供科学合理的书单安排。
- 知识问答:回答读者关于科学知识的疑问,提供准确、权威的答案。
- 学习指引:为读者提供科学学习的指导和建议,帮助读者更有效地学习。
- 数据收集:收集高质量的科学图书数据。
- 数据清洗:清洗数据,去除无效数据,确保数据质量。
- 模型微调:使用收集到的数据对LLM进行微调。
- API设计:设计易于使用的API接口,供前端交互。
- 服务部署:部署模型和API服务,确保稳定运行。
- 前端开发:设计用户友好的前端界面,方便读者使用。
- 持续改进:持续优化模型和API,确保服务不断改进和升级。
[√]--已完成 [×] 待完成 [~] 进行中
- [√] 数据收集
- [√] 采集图书元数据3W+
- [√] 采集部分图书全文PDF
- [~] 数据清洗
- [×] 模型微调
- [~] API设计
- [×] 服务部署
- [×] 前端开发
- [×] 持续改进
本项目计划采用MIT许可证,具体许可证文件将在项目开发过程中确定。
我们欢迎有兴趣的开发者和志愿者参与本项目的开发和改进。目前尚未建立贡献指南,将在项目进展中提供。
目前尚未设立专门的联系方式,我们将在后续提供更多信息。
感谢您对科学书海项目的关注!随着项目的推进,我们将提供更多详细信息和更新。敬请期待!
- 书生·浦语工具链:为该项目提供了基础技术支持。
- 书生·浦语实战营:为该项目提供了算力资源。