Science-books-LLMs(科学书海)

科学书海是一个基于书生·浦语工具链开发的项目，旨在利用高质量图书数据微调LLM（大型语言模型），为读者提供个性化的图书推荐、书单规划、知识问答和学习指引等服务。

项目目标

利用LLM的智慧能力，帮助读者更有效地探索科学书籍的海洋。
提供个性化的阅读体验，满足不同读者的学习和阅读需求。
提供学习指导，帮助读者拥有更高效的学习体验。

预计功能特性

图书推荐：根据读者的兴趣、阅读历史、搜书意向，推荐最符合其当下需求的科学图书。
书单规划：帮助读者规划阅读计划，提供科学合理的书单安排。
知识问答：回答读者关于科学知识的疑问，提供准确、权威的答案。
学习指引：为读者提供科学学习的指导和建议，帮助读者更有效地学习。

开发计划

数据收集：收集高质量的科学图书数据。
数据清洗：清洗数据，去除无效数据，确保数据质量。
模型微调：使用收集到的数据对LLM进行微调。
API设计：设计易于使用的API接口，供前端交互。
服务部署：部署模型和API服务，确保稳定运行。
前端开发：设计用户友好的前端界面，方便读者使用。
持续改进：持续优化模型和API，确保服务不断改进和升级。

开发进度

[√]--已完成 [×] 待完成 [~] 进行中

[√] 数据收集
- [√] 采集图书元数据3W+
- [√] 采集部分图书全文PDF
[~] 数据清洗
[×] 模型微调
[~] API设计
[×] 服务部署
[×] 前端开发
[×] 持续改进

许可证

本项目计划采用MIT许可证，具体许可证文件将在项目开发过程中确定。

贡献

我们欢迎有兴趣的开发者和志愿者参与本项目的开发和改进。目前尚未建立贡献指南，将在项目进展中提供。

联系方式

目前尚未设立专门的联系方式，我们将在后续提供更多信息。

感谢您对科学书海项目的关注！随着项目的推进，我们将提供更多详细信息和更新。敬请期待！

致谢

书生·浦语工具链：为该项目提供了基础技术支持。
书生·浦语实战营：为该项目提供了算力资源。

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
backend		backend
datasets		datasets
eval		eval
frontend		frontend
models		models
rag		rag
tools		tools
.gitignore		.gitignore
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Science-books-LLMs(科学书海)

项目目标

预计功能特性

开发计划

开发进度

许可证

贡献

联系方式

致谢

About

Releases

Packages

Languages

Ciciy-l/Science-books-LLMs

Folders and files

Latest commit

History

Repository files navigation

Science-books-LLMs(科学书海)

项目目标

预计功能特性

开发计划

开发进度

许可证

贡献

联系方式

致谢

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages