高分问题 - 第75页

Max Lich

Asked: 2020-04-20 18:42:38 +0000 UTC

如何有效地对行进行分组？

12

需要解决以下问题：

根据以下标准将唯一字符串集拆分为不重叠的组：

如果两行在一列或多列中有匹配的非空值，则它们属于同一组。

例如，线条
111;123;222
200;123;100
300;;100
都属于同一个组，因为前两行在第二列中具有相同的值，而后两行在第三列中123具有相同的值100

程序运行时间（30 秒）也有限制。我还可以添加行数——大约一百万。这是我的代码：

private static Set<TreeSet<Integer>> findLineGroups(List<String> lines) {
    Set<TreeSet<Integer>> resultSet = new TreeSet<>((Comparator<TreeSet<Integer>>) (trSet1, trSet2) -> {
        int diff = trSet2.size() - trSet1.size();
        if (diff != 0)
            return diff;

        Iterator<Integer> iterator1 = trSet1.iterator();
        Iterator<Integer> iterator2 = trSet2.iterator();
        while (iterator1.hasNext()) {
            diff = iterator1.next() - iterator2.next();
            if (diff != 0)
                return diff;
        }

        return 0;
    });

    Map<String, Integer> termLineGroupsPairs = new HashMap<>();
    List<TreeSet<Integer>> lineNumGroups = new ArrayList<>();

    for (int lineNum = 0; lineNum < lines.size(); lineNum++) {
        String line = lines.get(lineNum);
        String[] lineElements = line.replaceAll("\"", "").replaceAll(" ", "").split(";");
        Set<String> termSet = new HashSet<>(Arrays.asList(lineElements));
        termSet.remove("");

        Integer groupNum = null;
        TreeSet<String> tempSet = new TreeSet<>(termLineGroupsPairs.keySet());
        tempSet.retainAll(termSet); //оставляем только общие элементы
        if (!tempSet.isEmpty()) {
            String term = tempSet.first();
            groupNum = termLineGroupsPairs.get(term);
            lineNumGroups.get(groupNum).add(lineNum);
        }

        if (groupNum == null) {
            TreeSet<Integer> group = new TreeSet<>();
            group.add(lineNum);
            lineNumGroups.add(group);
            groupNum = lineNumGroups.size() - 1;
        }
        for (String term : termSet) {
            termLineGroupsPairs.put(term, groupNum);
        }
        if (lineNumGroups.size() % 1000 == 0)
            System.out.println(lineNumGroups.size());
    }

    resultSet.addAll(lineNumGroups);
    return resultSet;
}

而且我所有的解决方案都工作太久（我试图以不同的方式解决这个问题）。诚然，如果少于一千行，那么它可以快速运行（我符合指定的限制），并且几乎可以使用我的任何算法。

请告诉我如何解决这个问题（或在我的解决方案中进行哪些更改以使其快速运行）。

Kamerton

Asked: 2020-03-19 17:51:52 +0000 UTC

为什么 System.String.Empty 不为空？

12

好的。

也许我的问题因为它的不正确而令人困惑，但这只是为了让你和我有同样的感觉。

我用两个反编译器（dotPeek 和 ILSpy）反编译了 mscorelib.dll v4.0，它们都向我展示了这是一个字段readonly，并且没有在类中初始化。类 NOT partial。

当然，执行时，一切都很好string.Empty is ""，但是有人可以向我解释为什么会这样吗？如果不在这里（也找不到静态构造函数），那么该字段在哪里初始化？还是这些反编译器看不到东西？

daybreaker

Asked: 2020-03-07 17:42:27 +0000 UTC

比较图片的相似度

12

如何比较图1和图2？

图片编号 1

为了相似性，它们的大小没有必要不同。此外，它们不必是 100% 相似的。

研究这个主题的最佳材料是什么？

nick_gabpe

Asked: 2020-02-01 23:44:10 +0000 UTC

python 中 NaN 的奇怪工作：nan != nan 和 [nan] == [nan]

12

有这个代码：

a = float("nan")
a == a              # Получаем False
[a] == [a]          # Получаем True

为什么会这样？

Qwertiy

Asked: 2020-12-29 06:21:23 +0000 UTC

是否可以在指针算术中忽略空子？

12

有一个类A继承自该类B。但是，该类B不包含任何字段。如果我创建一个元素数组B，但将其用作元素数组A，它会正确吗？

该标准说这仅允许使用类似的类型：

当具有整数类型的表达式被添加到指针或从指针中减去时，结果具有指针操作数的类型。如果表达式 P 指向具有 n 个元素的数组对象 x 的元素 x[i]，86 表达式 P + J 和 J + P（其中 J 的值为 j）指向（可能是假设的）元素 x [ i + j ] 如果 0 ≤ i + j ≤ n ；否则，行为未定义。同样，表达式 P - J 指向（可能是假设的）元素 x [ i - j ] 如果 0 ≤ i - j ≤ n ；否则，行为未定义。

旁边描述了类型的相似性，但我无法理解在我的情况下类型是否相似。哪些类型被认为是相似的？

这是一个示例代码：~~https://ideone.com/ncRepZ~~ https://ideone.com/nMvJ0r
它是否包含未定义的行为？

#include <iostream>

using namespace std;

struct A
{
  int x;
  A(int x) : x(x) {}
  virtual ~A() {}
};

struct B : A
{
  B() : A(7) {}
};

int main()
{
  A *a = new B[4];

  for (size_t q=0; q<4; ++q)
    cout << q << ": " << a[q].x << endl;

  delete [] a;

  return 0;
}

如果仍然不允许这样做，是否足以检查这两种类型的大小是否相等https://ideone.com/iSkJk0

static_assert(sizeof (A) == sizeof (B), "B must have same size as A");

确保如果程序编译，那么它不包含UB？

如何有效地对行进行分组？

为什么 System.String.Empty 不为空？

比较图片的相似度

python 中 NaN 的奇怪工作：nan != nan 和 [nan] == [nan]

是否可以在指针算术中忽略空子？

我看不懂措辞

请求的模块“del”不提供名为“default”的导出

"!+tab" 在 HTML 的 vs 代码中不起作用

我正在尝试解决“猜词”的问题。Python

可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件？

Python解析野莓

问题：“警告：检查最新版本的 pip 时出错。”

帮助编写一个用值填充变量的循环。解决这个问题

尽管依赖数组为空，但在渲染上调用了 2 次 useEffect

数据不通过 Telegram.WebApp.sendData 发送

全部问题