大数据视域下的B站视频流行趋势研究。分析Bilibili排行榜视频数据,探究视频播放量与up主粉丝数的关系,视频类型、分区、地理位置分布等。包含了数据爬取、数据分析、数据可视化等完整的数据挖掘过程。
pip install bilibili-api-python
pip install -r requirements.txt
get_video_data.ipynb
: 获取Bilibili排行榜视频数据get_user_data.ipynb
: 获取视频对应的up主数据analysis.ipynb
: 数据分析rank_data.py
: 2024年6月30日Bilibili排行榜字典数据bilibili_rank.csv
: 2024年6月30日Bilibili排行榜视频数据bilibili_user.csv
: 2024年6月30日Bilibili排行榜视频对应的up主数据bilibili_TV.jpg
: Bilibili小电视mask
以下均基于2024年6月30日Bilibili排行榜数据(共100条)。
- 热门视频类型分布
- 分区分析
- up主头衔(official title)
- 完播率
- 观众年龄、性别、地区分布
- 观众兴趣分布
- 播放量来源(移动端、PC、站外、h5、云视听小电视)
- 转粉分析
- 游客占比
- 粉丝观看率
- 一个up主只能同时拥有一个热门视频,更新频繁的up主可能会将自己之前的热门视频顶掉