私有化部署 TrendRadar 开源项目 实现实时追踪热点咨询
你是否有这样的烦恼,想跟上信息潮流及时获取自己想关注的新闻,但是新闻咨询网站太多,又不想自己花大把时间每天去看,以前你可能会选择 rss 这类的订阅一堆网站然后每天花半小时去筛选一下,那么有没有一种程序能够实现定时爬虫然后通过办公软件或者微信推送给自己,然后在通勤上下班时间里拿出来看看。没错,有一款开源项目能够满足你这样的需求,那就是TrendRadar。
你是否有这样的烦恼,想跟上信息潮流及时获取自己想关注的新闻,但是新闻咨询网站太多,又不想自己花大把时间每天去看,以前你可能会选择 rss 这类的订阅一堆网站然后每天花半小时去筛选一下,那么有没有一种程序能够实现定时爬虫然后通过办公软件或者微信推送给自己,然后在通勤上下班时间里拿出来看看。没错,有一款开源项目能够满足你这样的需求,那就是TrendRadar。
几年前开始,为了将自己的杂七杂八的代码托管起来,自己建了代码私服,当时综合调研了下选择了比较轻量的Gitea,一是防止github、gitee、coding等产品托管的代码审查,二是为了应对墙,不然推送代码真吃力,Gitea1.19 版本之前不支持内置的CI/CD解决方案,所以是我自己使用的Gitea+Drone实现流程自动化。
这次要推荐的是一款可以纯离线使用,无需担心隐私泄露的开源OCR软件,开源项目已经快到5k star的项目,名称叫“Umi-OCR”,OCR图片转文字识别软件,完全离线。截屏/批量导入图片,支持多国语言、合并段落、竖排文字。可排除水印区域,提取干净的文本,基于 PaddleOCR 。