Skip to content

使用高质量图书数据微调LLM,并基于微调后的LLM提供图书推荐、书单规划、知识问答、学习指引等个性化读者服务。

Notifications You must be signed in to change notification settings

Ciciy-l/Science-books-LLMs

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Science-books-LLMs(科学书海)

科学书海是一个基于书生·浦语工具链开发的项目,旨在利用高质量图书数据微调LLM(大型语言模型),为读者提供个性化的图书推荐、书单规划、知识问答和学习指引等服务。

项目目标

  • 利用LLM的智慧能力,帮助读者更有效地探索科学书籍的海洋。
  • 提供个性化的阅读体验,满足不同读者的学习和阅读需求。
  • 提供学习指导,帮助读者拥有更高效的学习体验。

预计功能特性

  • 图书推荐:根据读者的兴趣、阅读历史、搜书意向,推荐最符合其当下需求的科学图书。
  • 书单规划:帮助读者规划阅读计划,提供科学合理的书单安排。
  • 知识问答:回答读者关于科学知识的疑问,提供准确、权威的答案。
  • 学习指引:为读者提供科学学习的指导和建议,帮助读者更有效地学习。

开发计划

  • 数据收集:收集高质量的科学图书数据。
  • 数据清洗:清洗数据,去除无效数据,确保数据质量。
  • 模型微调:使用收集到的数据对LLM进行微调。
  • API设计:设计易于使用的API接口,供前端交互。
  • 服务部署:部署模型和API服务,确保稳定运行。
  • 前端开发:设计用户友好的前端界面,方便读者使用。
  • 持续改进:持续优化模型和API,确保服务不断改进和升级。

开发进度

[√]--已完成 [×] 待完成 [~] 进行中

  • [√] 数据收集
    • [√] 采集图书元数据3W+
    • [√] 采集部分图书全文PDF
  • [~] 数据清洗
  • [×] 模型微调
  • [~] API设计
  • [×] 服务部署
  • [×] 前端开发
  • [×] 持续改进

许可证

本项目计划采用MIT许可证,具体许可证文件将在项目开发过程中确定。

贡献

我们欢迎有兴趣的开发者和志愿者参与本项目的开发和改进。目前尚未建立贡献指南,将在项目进展中提供。

联系方式

目前尚未设立专门的联系方式,我们将在后续提供更多信息。

感谢您对科学书海项目的关注!随着项目的推进,我们将提供更多详细信息和更新。敬请期待!

致谢

  • 书生·浦语工具链:为该项目提供了基础技术支持。
  • 书生·浦语实战营:为该项目提供了算力资源。

About

使用高质量图书数据微调LLM,并基于微调后的LLM提供图书推荐、书单规划、知识问答、学习指引等个性化读者服务。

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages