自定义Rss源比较
万物皆可RSS
简书荒废有近两年,最近发现一个RSS神器,所以又有了动力写一点东西。
前年关于使用RSS订阅微信公众号、知乎、社交网络等,有写几篇文章:
- 【干货】如何高效地订阅微信公众号
- 【干货】如何通过 RSS 订阅知乎
- 【干货】如何通过RSS订阅社交网络
其中,最最主要的方法是使用部署的Huginn去制作相应的RSS,但是,这种方法的学习成本稍高,对不懂编程语言的人不太友好;那么到底有没有更简单的方法呢?果真,Github就出现了这样一个强大的工具——RSSHub。
最近花了一点时间研究后发现,这个工具实在是功能强大且使用简单,所以就想一定要推荐给大家。
如果想了解并部署Huginn,可以看我的这篇文章:Huginn 安装教程 — 建立你自己的 IFTTT
1. 入门介绍
正如开发者所言,RSSHub是一个轻量、易于扩展的RSS生成器,可以给任何奇奇怪怪的内容生成RSS订阅源。Ta所言的奇奇怪怪基本上囊括了大家日常生活中的所有阅读平台,包含但不限于简书、知乎、微信公众号、微博等等,它的使用指南上列举了所有平台的RSS生成方法。
作者还提供了一个已经部署好的RSSHub服务器供大家免费使用;但是,因为使用的人稍多,针对一些反爬虫策略比较严格的平台,可能这个免费服务器地址已经进入了他们的黑名单;因此,强烈建议有能力的朋友,自己搭建一个自用服务器。
部署方法请参见这里:https://docs.rsshub.app/install/,可以使用免费的Heroku平台,一键式部署真得超级方便
2.使用方法
使用方法真的是太简单了,直接在RSSHub服务器地址后面添加二级地址即可,你可以直接在使用指南上的例子上进行修改。
接下来有必要隆重介绍的是:RSSHub还可以使用URL query过滤内容,且支持正则表达式,简直是强大到无与伦比,下面举个简单的例子:
1、首先为鼠绘汉化网微博制作RSS:https://rsshub.app/weibo/user2/1948247017,这样你就可以知道他们所有漫画的动态
2、如果你只想知道银魂和海贼王的动态,可以修改上面的RSS:https://rsshub.app/weibo/user2/1948247017?filter_title=银魂|海贼王
3、如果你只想知道银魂和海贼王的汉化情况,再修改上面的RSS:https://rsshub.app/weibo/user2/1948247017?filter_title=[银魂|海贼王].*?第
作者提供的免费服务器在过滤时,有时候会不准确,强烈建议使用自己部署的自用服务器
3.与Huginn结合使用
不懂Huginn的朋友,可以略过这部分
既然RSSHub如此功能强大且使用简单,如果结合Huginn使用的话,更是事半功倍,可以省去写最难的Webhook Agent(当然,如果是RSSHub没有配置的平台或网页,还是需要用上Webhook
Agent),下面提供一下我自己结合Huginn使用的流程,供大家参考。
RSSHub结合Huginn的使用流程
4.结语
在【干货】信息大爆炸时代,该如何高效阅读这篇文章里,我觉得“使用RSS是现代社会断舍离的一种方式”,当你养成使用RSS阅读的习惯,你就开始自己主动地处理外界信息,而不是被动地接收信息,我觉得这一点是尤为重要的。
原文链接:
https://www.jianshu.com/p/13a2df785334
作者:xzonepiece
RSSHub 和 Huginn 的区别:
RSSHub 使用简单,使用现成的抓取规则,适用于国内主流网站;但无法抓取对小众网站,必须 RSSHub 官方定制订阅源。
Huginn 适用于所有网站,可设定抓取频率、内容结构、js结果、输出样式等;但部署、配置复杂,入门门槛高,需要针对网站单独定制抓取规则。
RSSHub不如Huginn灵活,原因在于它依赖于RSSHub既定的规则,当然你也可以自己设置规则,但是难度也不小。不过,经过这几年的发展RSSHub支持的网站RSS已经非常多了,包括了社交媒体 、新媒体 、传统媒体 、论坛 、博客 、 直播 、大学通知 、预报预警 、出行旅游 、购物 、游戏 、 政务消息 、科学期刊等。
RSSHub安装与配置
RSSHub部署的难点在于首次安装与配置,原因是RSSHub需要安装在一台VPS主机上,当然这对于经常建站的朋友或者有VPS操作经验来说是一件非常简单的事情。没有VPS的朋友可以参考这个购买一个:VPS主机排行榜单。
Huginn 是一个强大的 IFTTT 应用,用它来生成 RSS 源简直是大材小用(主要是他动辄 200M 的内存占用)。不过某些情况下我需要监视特定站点并在内容变化时得到通知,个人向为主,这类就不适合写 RSSHub 的规则。
使用门槛比 RSSHub 略低,可视化界面还是比较友好的,不过新手上手还是会有点困难,了解了 Huginn 的工作原理和基本的 Liquid 语法之后就手到擒来了。
RSS 阅读是「服务 + 客户端」的结合体。服务负责帮我们从 RSS 源抓取文章,比如 Inoreader、Feedly、NewsBlur、Feedbin 等;客户端则是我们最后阅读的容器,比如 Reeder、Unread、Fiery Feeds 等。
虽说基本所有的 RSS 客户端都可以添加 RSS 源,然后在应用内刷新抓取文章,但和真正的 RSS 服务比,客户端还是少了些功能:
云同步:在不同平台或者不同客户端里,同步我们的订阅源和阅读记录。
过滤:通过一定的规则,筛选掉一些我们不感兴趣的文章。
自动化:可以和 IFTTT、Zapier 等服务联动。
如果你仅需要第一点云同步,那么选择任意一个免费的 RSS 服务,或者选用付费 RSS 服务的免费档就够用了。值得一提的是,Fiery Feeds 在今年的 2.2 版本更新中加入了通过 iCloud 同步功能(详见第 22 期奏折),相当于内置了一个 RSS 服务。不过,Fiery Feeds 内置的服务只具备了云同步的特点,没有过滤和自动化。
而后面的这两点,才是我们选择付费 RSS 服务,并且为它们掏钱的理由。因为当你需要过滤时,才说明你每天的阅读量很大,大到需要借助自动化的手段来帮你筛选掉不感兴趣的文章。即便是不想读的文章,也至少需要花掉我们阅读标题的精力和时间,就算每天只有几十篇,累积起来也是很可观的数量。借助过滤把它们自动筛选掉,可以帮助我们节约大量的时间和精力。
利用Python实现高度定制专属RSS
前言
本文转载自Jianger's Blog,欢迎来访订阅。本篇属于定制RSS
系列终极一弹,是三种方式中自由度最高、定制化最强的,也需要一定的编程能力。附上前两篇链接:1、利用Feed43为网站自制RSS源;2、如何优雅快速地利用Huginn制作专属RSS。开始之前先对比一下以上三种方式:
方法 | 优势 | 不足 | 复杂性 | 稳定性 | 定制性 |
---|---|---|---|---|---|
Feed43 | 快速、便捷、免费 | 免费版需间隔6小时,部分网站不可用 | 简单 | 一般 | 中 |
Huginn | 快速、安装后可便捷添加 | 专业化程度偏高,需要服务器 | 高 | 高 | 高 |
Python | 高度定制、占用内存小 | 专业化程度偏高,不可随意改正 | 一般 | 高 | 极高 |
看个人需要进行选择,Huginn虽安装麻烦点,但是一个自动化神器,妙用不仅局限于此。
万物皆可RSS
简书荒废有近两年,最近发现一个RSS神器,所以又有了动力写一点东西。
前年关于使用RSS订阅微信公众号、知乎、社交网络等,有写几篇文章:
- 【干货】如何高效地订阅微信公众号
- 【干货】如何通过 RSS 订阅知乎
- 【干货】如何通过RSS订阅社交网络
其中,最最主要的方法是使用部署的Huginn去制作相应的RSS,但是,这种方法的学习成本稍高,对不懂编程语言的人不太友好;那么到底有没有更简单的方法呢?果真,Github就出现了这样一个强大的工具——RSSHub。
最近花了一点时间研究后发现,这个工具实在是功能强大且使用简单,所以就想一定要推荐给大家。
如果想了解并部署Huginn,可以看我的这篇文章:Huginn 安装教程 — 建立你自己的 IFTTT
1. 入门介绍
正如开发者所言,RSSHub是一个轻量、易于扩展的RSS生成器,可以给任何奇奇怪怪的内容生成RSS订阅源。Ta所言的奇奇怪怪基本上囊括了大家日常生活中的所有阅读平台,包含但不限于简书、知乎、微信公众号、微博等等,它的使用指南上列举了所有平台的RSS生成方法。
作者还提供了一个已经部署好的RSSHub服务器供大家免费使用;但是,因为使用的人稍多,针对一些反爬虫策略比较严格的平台,可能这个免费服务器地址已经进入了他们的黑名单;因此,强烈建议有能力的朋友,自己搭建一个自用服务器。
部署方法请参见这里:https://docs.rsshub.app/install/,可以使用免费的Heroku平台,一键式部署真得超级方便
2.使用方法
使用方法真的是太简单了,直接在RSSHub服务器地址后面添加二级地址即可,你可以直接在使用指南上的例子上进行修改。
接下来有必要隆重介绍的是:RSSHub还可以使用URL query过滤内容,且支持正则表达式,简直是强大到无与伦比,下面举个简单的例子:
1、首先为鼠绘汉化网微博制作RSS:https://rsshub.app/weibo/user2/1948247017,这样你就可以知道他们所有漫画的动态
2、如果你只想知道银魂和海贼王的动态,可以修改上面的RSS:https://rsshub.app/weibo/user2/1948247017?filter_title=银魂|海贼王
3、如果你只想知道银魂和海贼王的汉化情况,再修改上面的RSS:https://rsshub.app/weibo/user2/1948247017?filter_title=[银魂|海贼王].*?第
作者提供的免费服务器在过滤时,有时候会不准确,强烈建议使用自己部署的自用服务器
3.与Huginn结合使用
不懂Huginn的朋友,可以略过这部分
既然RSSHub如此功能强大且使用简单,如果结合Huginn使用的话,更是事半功倍,可以省去写最难的Webhook Agent(当然,如果是RSSHub没有配置的平台或网页,还是需要用上Webhook
Agent),下面提供一下我自己结合Huginn使用的流程,供大家参考。
RSSHub结合Huginn的使用流程
4.结语
在【干货】信息大爆炸时代,该如何高效阅读这篇文章里,我觉得“使用RSS是现代社会断舍离的一种方式”,当你养成使用RSS阅读的习惯,你就开始自己主动地处理外界信息,而不是被动地接收信息,我觉得这一点是尤为重要的。
原文链接:
https://www.jianshu.com/p/13a2df785334
作者:xzonepiece
RSSHub 和 Huginn 的区别:
RSSHub 使用简单,使用现成的抓取规则,适用于国内主流网站;但无法抓取对小众网站,必须 RSSHub 官方定制订阅源。
Huginn 适用于所有网站,可设定抓取频率、内容结构、js结果、输出样式等;但部署、配置复杂,入门门槛高,需要针对网站单独定制抓取规则。
RSSHub不如Huginn灵活,原因在于它依赖于RSSHub既定的规则,当然你也可以自己设置规则,但是难度也不小。不过,经过这几年的发展RSSHub支持的网站RSS已经非常多了,包括了社交媒体 、新媒体 、传统媒体 、论坛 、博客 、 直播 、大学通知 、预报预警 、出行旅游 、购物 、游戏 、 政务消息 、科学期刊等。
RSSHub安装与配置
RSSHub部署的难点在于首次安装与配置,原因是RSSHub需要安装在一台VPS主机上,当然这对于经常建站的朋友或者有VPS操作经验来说是一件非常简单的事情。没有VPS的朋友可以参考这个购买一个:VPS主机排行榜单。
Huginn 是一个强大的 IFTTT 应用,用它来生成 RSS 源简直是大材小用(主要是他动辄 200M 的内存占用)。不过某些情况下我需要监视特定站点并在内容变化时得到通知,个人向为主,这类就不适合写 RSSHub 的规则。
使用门槛比 RSSHub 略低,可视化界面还是比较友好的,不过新手上手还是会有点困难,了解了 Huginn 的工作原理和基本的 Liquid 语法之后就手到擒来了。
RSS 阅读是「服务 + 客户端」的结合体。服务负责帮我们从 RSS 源抓取文章,比如 Inoreader、Feedly、NewsBlur、Feedbin 等;客户端则是我们最后阅读的容器,比如 Reeder、Unread、Fiery Feeds 等。
虽说基本所有的 RSS 客户端都可以添加 RSS 源,然后在应用内刷新抓取文章,但和真正的 RSS 服务比,客户端还是少了些功能:
云同步:在不同平台或者不同客户端里,同步我们的订阅源和阅读记录。
过滤:通过一定的规则,筛选掉一些我们不感兴趣的文章。
自动化:可以和 IFTTT、Zapier 等服务联动。
如果你仅需要第一点云同步,那么选择任意一个免费的 RSS 服务,或者选用付费 RSS 服务的免费档就够用了。值得一提的是,Fiery Feeds 在今年的 2.2 版本更新中加入了通过 iCloud 同步功能(详见第 22 期奏折),相当于内置了一个 RSS 服务。不过,Fiery Feeds 内置的服务只具备了云同步的特点,没有过滤和自动化。
而后面的这两点,才是我们选择付费 RSS 服务,并且为它们掏钱的理由。因为当你需要过滤时,才说明你每天的阅读量很大,大到需要借助自动化的手段来帮你筛选掉不感兴趣的文章。即便是不想读的文章,也至少需要花掉我们阅读标题的精力和时间,就算每天只有几十篇,累积起来也是很可观的数量。借助过滤把它们自动筛选掉,可以帮助我们节约大量的时间和精力。