是否可以以某种方式自定义 QTabWidget？

Question

Виктория

Asked:2021-12-24 01:50:16 +0000 UTC2021-12-24 01:50:16 +0000 UTC 2021-12-24 01:50:16 +0000 UTC

无法解析所有频道帖子

772

有一个代码

from telethon.sync import TelegramClient
from telethon import functions, types
import datetime

api_id=API_ID
api_hash='API_TOKEN'

with TelegramClient('name', api_id, api_hash) as client:
    result = client(functions.messages.GetHistoryRequest(
        peer='любой канал',
        offset_id=0, 
        offset_date=0,
        add_offset=0,
        limit=100000,
        max_id=0,
        min_id=0,
        hash=0
    ))
    result=result.messages
    for i in range(len(result)):
        if result[i].message!='':
            nic=result[i].message
            
            print('--------------start-------------------------\n\n')
            print(nic)
            print('------------------end---------------------\n\n')
            
            with open('result.txt', 'ab') as f:
                f.write(nic.encode('utf-8'))
                f.write('\n\n\n'.encode('utf-8'))

它的任务是解析来自电报频道的帖子，并将它们写入文本编辑器。但是这段代码并没有解析所有帖子，而是大约 75 个帖子。请告诉我如何解析整个频道（或直到给定的帖子）。有一个选项可以使用 offset_date=datetime.datetime(2020, 12, 10) 在循环中进行迭代，但随后帖子将被重复

1 个回答

Voted

Arty · Answer 1 · 2021-12-24T11:16:38Z

根据文档，您可以使用offset_id该参数逐页提取整个历史记录。

为此，我们设置了一个相对较小的限制，例如limit=100，然后每条减去 100 条，为了请求下一页，我们简单地在offset_id最后一条消息的 id 中注明，即 result[-1].id，之后，只会提取比具有给定 id 的帖子“旧”的帖子，即第二等页。

完整修改后的代码如下：

from telethon.sync import TelegramClient
from telethon import functions, types
import datetime

api_id=12345
api_hash='API_TOKEN'

with TelegramClient('name', api_id, api_hash) as client:
    limit, cur_id = 100, 0
    while True:
        result = client(functions.messages.GetHistoryRequest(
            peer='любой канал', offset_id=cur_id, offset_date=0,
            add_offset=0, limit=limit, max_id=0, min_id=0, hash=0,
        ))
        result=result.messages
        if len(result) < limit:
            break
        for i in range(len(result)):
            if result[i].message!='':
                nic=result[i].message
                
                print('--------------start-------------------------\n\n')
                print(nic)
                print('------------------end---------------------\n\n')
                
                with open('result.txt', 'ab') as f:
                    f.write(nic.encode('utf-8'))
                    f.write('\n\n\n'.encode('utf-8'))
        cur_id = result[-1].id

无法解析所有频道帖子

如何从列表中打印最大元素（str 类型）的长度？

如何在 PyQT5 中清除 QFrame 的内容

如何将具有特定字符的字符串拆分为两个不同的列表？

导航栏活动元素

是否可以将文本放入数组中？[关闭]

如何一次用多个分隔符拆分字符串？

如何通过 ClassPath 创建 InputStream？

在一个查询中连接多个表

对列表列表中的所有值求和

如何对齐 string.Format 中的列？

无法解析所有频道帖子

1 个回答

相关问题