的类似,写了个脚本每天爬取arxiv中包含了cs.CV 和 cs.CL类别的最新论文,用来捕捉CV和NLP领域的最新方向,每天起床后在手机上花二十分钟就可以快速刷完。

还用了DeepSeek总结摘要中的内容(DeepSeek 00:30-08:30打折,非常便宜。每天总结cs.CV和cs.CL里面的文章只需要一两毛钱),最后按照main category汇总成markdown文档。

使用GitHub中的环境变量配置大模型api key、model name等参数,别人看不见。

点击标题就可以跳转到文章的arxiv页面,点击Details就可以展示(默认隐藏,节省空间)DeepSeek总结的motivation、method、result以及完整abstract。

点个Star即可白嫖~

Q&A

Q1:为什么该工具中cs.CV的文章数量小于官网中cs.CV中的文章数量

A1:官网的列表展示了所有带有cs.CV类别标签的论文(假如一共是100篇),这个工具首先从官网获取这100篇,然后将cs.CV排在第一位的论文统计到cs.CV类别中。由于有的论文的类别设置为例如cs.AI, cs.CV,所以这些论文被统计到了cs.AI类别(但这些论文在官网的列表中均存在于cs.AI和cs.CV类别),所以这个工具中cs.CV数量会减少,但是所有100篇文章都肯定是在这个列表里面的,只不过被分到了其他类别。之所以按照排在第一位的类别进行分类是因为考虑大家在上传论文的时候都会选择更加符合这篇文章内容类别作为primary category,所以这个统计方式或许能够过滤出那些与cv关系不太大的文章。