如何创建一个内容聚合机器人,将多个信息源汇总到一个Telegram频道?
2 个回答
Telegram机器人+Python脚本是目前最流行的方式。首先注册一个Telegram bot并获取token,然后建立一个群并给机器人管理员权限。
抓取微信公众号内容比较麻烦,需要第三方解析接口(比如百度“微信文章解析API”),Python requests调用接口抓取文章。新闻网站可以BeautifulSoup直接解析html内容。
定时任务建议使用APScheduler库设置每个小时采集一次。内容去重建议使用redis保存标题指纹。推送消息前要处理好图片和排版,建议使用Markdown。
代码框架可以在github搜索"telethon tutorial",官方文档很全面,新手建议先从推送天气预报这种简单功能入手,逐步增加难度。出现报错不要急于问,先看报错信息error message,90%的报错都能找到解决方法。
你要用Python编写一个爬虫程序,定时抓取目标网站以及目标公众号文章。然后通过Telegram Bot API接口推送文章到你的频道。注意抓取频率不能太高,不然很容易被封。建议用Flask+APScheduler实现定时抓取,用BeautifulSoup实现文章解析,抓取文章时加入异常处理防止程序崩溃,抓取文章前过滤掉重复内容。整个程序需要基本的编程能力,如果不会可以找开发者实现。