最新问题 - 第339页

Irking

Asked: 2024-08-24 20:45:23 +0000 UTC

解析 Habr (Python + LxmlSoup)

7

我刚刚开始尝试解析并决定制作一个发送文章列表的机器人。

我在这里收集了标题和最近文章的链接：

from LxmlSoup import LxmlSoup
import requests

html = requests.get('https://habr.com/ru/articles/').text
soup = LxmlSoup(html)

links = soup.find_all('a', class_='tm-title__link')

for i, link in enumerate(links, start=1):
    print(f'{i}: {link.text()}')
    print('https://habr.com' + link.get('href'), '\n')

现在的问题是：

如何将解析限制为 3-5 个结果？这样他就不会收集整个页面，而只会收集新的 3-5 篇文章（它们是在 hub 上订购的）。
如何获取一篇文章的发表时间？ Hub上的标题旁边写着“55分钟前”，我想记录一个特定的时间（收集统计数据，例如“周四，发表文章的平均时间为40分钟”）
在哪里以及从哪里阅读有关 html 的内容 - 我很难理解要查找哪些标签以及如何从中获取信息。

如果有的话，这些任务本质上纯粹是教育性的。

Andrewkoro105

Asked: 2024-08-24 17:30:17 +0000 UTC

如何修复：absl::flat_hash_set 中的“构造值与查找键不匹配”

5

我正在使用abseil 的set 实现。当我更改 Indexed<T_> 的比较函数时：

曾是：

template<typename T_>
auto Indexed<T_>::operator==(Indexed<T_> const& indexed) const -> bool {
    return indexed.id_ == id_;
}

变成：

template<typename T_>
auto Indexed<T_>::operator==(Indexed<T_> const& indexed) const -> bool {
    return indexed.id_ == id_ && id_ != 0;
}

我得到：

Interface_Engine_ex: .../abseil-src/absl/container/internal/raw_hash_set.h:3156: 
  void absl::container_internal::raw_hash_set<
    absl::container_internal::FlatHashSetPolicy<ie::Indexed<ie::TextStyle>>, 
    absl::hash_internal::Hash<ie::Indexed<ie::TextStyle>>, 
    std::equal_to<ie::Indexed<ie::TextStyle>>, 
    std::allocator<ie::Indexed<ie::TextStyle>>>::emplace_at(size_t, Args &&...) 

[Policy = absl::container_internal::FlatHashSetPolicy<ie::Indexed<ie::TextStyle>>, 
  Hash = absl::hash_internal::Hash<ie::Indexed<ie::TextStyle>>, 
  Eq = std::equal_to<ie::Indexed<ie::TextStyle>>, 
  Alloc = std::allocator<ie::Indexed<ie::TextStyle>>, 
  Args = <ie::Indexed<ie::TextStyle>>]: 

Assertion `PolicyTraits::apply(FindElement{*this}, *iterator_at(i)) == iterator_at(i) && 
  "constructed value does not match the lookup key"' failed.

哈希函数如下所示：

template<typename T_>
auto std::hash<ie::Indexed<T_> >::operator()(ie::Indexed<T_> const& indexed) -> size_t{
    return indexed.get_id();
}

Rabenburg

Asked: 2024-08-24 15:36:47 +0000 UTC

如何正确检查字符串中是否存在某些字符？

5

请帮助并优化我的代码。

用户必须输入某些值（日期、时间等）。如果您输入的内容不正确，您将收到重复请求。

需要检查他输入的字符串是否包含指定的参数，例如 format 中的时间ЧЧ:ММ或 format 中的日期ДД.ММ.ГГ。

下面给出了检查时间的示例。

我写了一个输入检查，但是：

我可能没有考虑到某些事情；
当然，这项检查可以做得更好、更简单。

protected void checkSymbbol() {
    String valuez = "1df6:sdf01";
    String value = valuez.replaceAll("[^\\d:]", "");
    if (value.length() == 5) {
        if (value.contains(":")){
            System.out.println("верно");
        } else {
            System.out.println("ошибка");
        }
    } else
        System.out.println("ошибка");
}

在此示例中，检查用户是否输入了16:01.

polsok

Asked: 2024-08-24 03:30:16 +0000 UTC

将各种yaml文件解析到一张表中

5

有几个yaml文件：

文件1

name: phone1
spec:
  type1:
    - name: cpu
      value: 8 core
    - name: RAM
      value: 8Gb
      type:
        - name: ttt1
        - name: ttt2
  color: gold

文件2

name: phone2
spec:
  type1:
    - name: cpu
      value: 4 core
    - name: RAM
      value: 4Gb
      type:
        - name: ttt3
        - name: ttt4
  size:
    length: 80
    height: 10
    weight: 40

文件3

name: phone3
spec:
  type1:
    - name: cpu
      value: 2 core
    - name: RAM
      value: 2Gb
      type:
        - name: ttt5
        - name: ttt6

它们需要以表格形式呈现，其中第一列是键，其余是值。如果密钥不在文件中，则单元格保持为空

该表将如下所示：

电话	文件1	文件2	文件3
姓名	电话1	电话2	电话3
规格.type1.0.名称	中央处理器	中央处理器	中央处理器
规格.type1.0.值	8核	4核	2核
规格.类型1.1.名称	内存	内存	内存
规格.类型1.1.值	8Gb	4GB	2GB
规格.type1.1.type.0.名称	TT1	ttt3	ttt5
规格.type1.1.type.1.名称	TT2	TT4	TT6
规格尺寸长度		80
规格尺寸高度		10
规格尺寸重量		40
规格颜色	金子

其实这样的文件还有很多，我只是举了一些例子

我正在尝试解析所有这些：这是一个文件的示例：

import yaml
import pandas as pd

# Загрузка YAML-файла в словарь
def GetData(data, prefix):
    if isinstance(data, dict):
        for k, v in data.items():
            yield from GetData(v, f'{prefix}/{k}')
    elif isinstance(data, list):
        for i, v in enumerate(data):
            yield from GetData(v, f'{prefix}/{i}')
    else:
        yield (prefix, data)

# Путь к YAML-файлу
def var1(filename: str):
    with open(filename, "r") as f:
        yaml_data = yaml.safe_load(f)
        retval = pd.DataFrame(GetData(yaml_data, ''), columns=['0', filename])
    return retval

var1('file1.yaml').to_csv('data.csv', index=False)

结果：

电话	文件1
姓名	电话1
规格.type1.0.名称	中央处理器
规格.type1.0.值	8核
规格.类型1.1.名称	内存
规格.类型1.1.值	8Gb
规格.type1.1.type.0.名称	TT1
规格.type1.1.type.1.名称	TT2
规格颜色	金子

所有内容都适用于一个文件，但不可能合并多个文件中的数据。

这是多个文件的选项：

import yaml
import pandas as pd
files = ["file1.yaml", "file2.yaml", "file3.yaml"]

def var2(filename: str):
    with open(filename, "r") as f:
        retval = pd.DataFrame(pd.json_normalize(yaml.safe_load(f))).T
        retval = retval.rename(columns={0:filename})
    return retval
pd.concat([var2(file) for file in files], axis=1).to_csv('results/data2.csv', index=True)

结果：

电话	文件1	文件2	文件3
姓名	电话1	电话2	电话3
规格类型1	"[{'name': 'cpu', 'value': '8 核'}, {'name': 'RAM', 'value': '8Gb', 'type': [{'name': 'ttt1 '}, {'name': 'ttt2'}]}]"	"[{'name': 'cpu', 'value': '4 核'}, {'name': 'RAM', 'value': '4Gb', 'type': [{'name': 'ttt3 '}, {'name': 'ttt4'}]}]"	"[{'name': 'cpu', 'value': '2 核'}, {'name': 'RAM', 'value': '2Gb', 'type': [{'name': 'ttt5 '}, {'name': 'ttt6'}]}]"
规格颜色	金子
规格尺寸长度		80
规格尺寸高度		10
规格尺寸重量		40

这里还有另一个问题：嵌套键未被解析。

帮助解决：为了解析所有文件，每个嵌套键都输入到单独的行中，并且空键也显示在表中

Никитоз Саныч

Asked: 2024-08-24 01:54:33 +0000 UTC

f 线的条件结构

10

文本字符串的值取决于某些条件。
有三个条件 - 还有三个字符串值。

我怎样才能将其融入f-строку？

不要误会我的意思，但是在互联网上，在f-строки指南中，他们最大限度地描述了替换值的酷炫程度。

关于条件，我只找到这样的条目：

   f'{"<значение 1>" if <условие> else "<значение 2>"}'

是否可以使其具有三个值（我尝试f-строку在适当的位置构建另一个值<значение 2>- 但没有成功）？

解析 Habr (Python + LxmlSoup)

如何修复：absl::flat_hash_set 中的“构造值与查找键不匹配”

如何正确检查字符串中是否存在某些字符？

将各种yaml文件解析到一张表中

f 线的条件结构

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

全部问题