数据由QTNiCheng
用python爬虫获得的数据。数据仅节选时间部分,并未对内容进行分析
- 分组->统计->排序
- 将文件传入,因为要知道具体数据是什么此处选用字符流,字符流 java中字符编码是Unicode,可以识别奇怪的字符
- 用字符流注意配合使用缓冲区
- 将所有数据传入ArrayList(其实就是一个动态数组
- 利用Map不可重复key的特点,键值来存储重复的次数
- 对map排序treemap
- 键值升序排序输出
- 在头10分钟里总共发了1048576条弹幕(数据量还是很可怕的
- 在9:54秒开始,弹幕数突然由千条弹幕上升到万条甚至2万条弹幕,可见此时应该是第一个节目的开始,或者是集体喊出口号:哔哩哔哩 (゜-゜)つロ 干杯~-bilibili
3.在9分57秒的时候弹幕数量是前10分钟之最 21358
4.整个程序运行0.462s 这个方法来统计数据还是很快的,第一次写的时候用,读一条匹配加一的方法,快好几倍,具体数据忘了
5.这个程序是QTNiCheng 在线上问我Java能否实现python中一个排序小工具,然后自己写了一个