RError.com

RError.com Logo RError.com Logo

RError.com Navigation

  • 主页

Mobile menu

Close
  • 主页
  • 系统&网络
    • 热门问题
    • 最新问题
    • 标签
  • Ubuntu
    • 热门问题
    • 最新问题
    • 标签
  • 帮助
主页 / user-336595

gangsta's questions

Martin Hope
gangsta
Asked: 2020-05-06 14:43:10 +0000 UTC

用于评估通信质量的时间序列机器学习模型

  • 3

有必要在时间序列上建立机器学习模型来评估通信质量。

该数据集是在 14 天 (01/15/2016-01/28/2016) 内收集的,包含 7026706 行和 6 列:Dest。IP、最后一跳 IP、LQ、NLQ、成本。在这个数据集中,我为所有行添加了一个日期列并删除了 Dest 列。IP、最后一跳 IP、NLQ、成本。结果,我得到了踪迹。数据集。

在此处输入图像描述

接下来,我根据日期绘制了 LQ 值。

在此处输入图像描述

并对最后一次观测(24小时)进行了预测:0.9105833333333333

目前的代码:

import pandas as pd
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from glob import glob
from datetime import datetime, time
from pandas.plotting import autocorrelation_plot
from statsmodels.graphics.tsaplots import plot_acf

#Формирование датасета
files = glob("/content/newDataset/*.tsv")
dataset = pd.concat([pd.read_csv(f, sep="\t", skiprows=1) for f in files], 
           ignore_index=True)

n_samples = 7026706 
dt_from = pd.to_datetime("2016-01-15 00:00:00.000000")
dt_to = pd.to_datetime("2016-01-28 23:59:59.999999")
dataset["DateTime"] = pd.date_range(dt_from, dt_to, periods=n_samples)
dataset['LQ'] = dataset.LQ.astype('float64')
#df = pd.DataFrame(dataset)
del dataset['Dest. IP']
del dataset['Last hop IP']
del dataset['NLQ']
del dataset['Cost']
#dataset.drop(['Dest. IP', 'Last hop IP', 'NLQ', 'Cost'], axis=1)
print(dataset)

#График
def plot_series(time, series, format="-", start=0, end=None, label=None):
    plt.plot(time[start:end], series[start:end], format, label=label)
    plt.xlabel("DateTime")
    plt.ylabel("LQ")
    if label:
        plt.legend(fontsize=14)
    plt.grid(True)

def trend(time, slope=0):
    return slope * time

time = dataset['DateTime']
series = dataset['LQ']
plt.figure(figsize=(30, 6))
#plot_series(time, series)
#plt.show()
dataset.set_index("DateTime")["LQ"].rolling(window=600000).mean().plot()

#прогноз по последнему наблюдению
def moving_average(series, n):
    return np.average(series[-n:])

moving_average(dataset.LQ, 24)

由于我的机器学习能力不强,那么:

  1. 我需要平滑时间序列吗?
  2. 什么模型可以用于这个任务?
  3. 我是否正确理解没有异常值并且该系列是固定的?

项目文件。

LQ 与日期/时间图和相关图 FB先知

python
  • 2 个回答
  • 10 Views
Martin Hope
gangsta
Asked: 2020-05-04 23:34:23 +0000 UTC

无法建立一个值对日期的依赖性的折线图

  • 3

我正在制作一个 ML 模型 - 基于时间序列的链接质量预测。我上传了数据集,准备好了。我想构建一个值对日期的依赖性的线性图,但我得到了一个“粥”(副主编,请参阅更改历史中的屏幕):

import pandas as pd
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt
from glob import glob
from datetime import datetime, time
from pandas.plotting import autocorrelation_plot
from statsmodels.graphics.tsaplots import plot_acf

files = glob("/content/newDataset/*.tsv")
dataset = pd.concat([pd.read_csv(f, sep="\t", skiprows=1) for f in files], 
           ignore_index=True)

n_samples = 6992974 
dt_from = pd.to_datetime("2016-01-15 00:00:00.000000")
dt_to = pd.to_datetime("2016-01-28 23:59:59.999999")
dataset["DateTime"] = pd.date_range(dt_from, dt_to, periods=n_samples)
dataset['LQ'] = dataset.LQ.astype('float64')
dataset.head()

def plot_series(time, series, format="-", start=0, end=None, label=None):
    plt.plot(time[start:end], series[start:end], format, label=label)
    plt.xlabel("DateTime")
    plt.ylabel("LQ")
    if label:
        plt.legend(fontsize=14)
    plt.grid(True)

def trend(time, slope=0):
    return slope * time

time = dataset['DateTime']
series = dataset['LQ']
plt.figure(figsize=(10, 6))
plot_series(time, series)
plt.show()

它可以与什么连接?

python
  • 1 个回答
  • 10 Views
Martin Hope
gangsta
Asked: 2020-05-01 23:44:35 +0000 UTC

向数据集添加日期和时间

  • 1

我有两个数据集——一个是训练,第二个是主要的。

需要为每个数据集添加一个新列,该列又必须填充日期和时间(我将在模型中使用时间序列)。

第一个数据集包含 498534 条记录。开始日期/时间值为2016-01-15 00:00:00,结束值为2016-01-15 23:59:59。我计算出平均 5-6 条记录应该在一秒钟内落下。

第二个数据集包含 4406900 条记录。开始日期/时间值为2016-01-16 00:00:00,结束值为2016-01-28 23:59:59。平均还 - 5-6 记录一秒钟。

在此处输入图像描述

我用谷歌搜索了熊猫日期时间文档,但仍然不明白如何最终实现这一点。

python
  • 1 个回答
  • 10 Views
Martin Hope
gangsta
Asked: 2020-05-01 17:17:40 +0000 UTC

将多个 .tsv 文件合并为一个

  • 2

我正在做 ML 来预测无线网状网络中的链路质量。我有一个包含大量 .tsv 文件(大约 4000 个)的数据集。文件格式:topo-2016-01-15-00_00.tsv;topo-2016-01-15-00-00_05.tsv; ...; topo-2016-01-15-15-23_55.tsv。以 5 分钟的间隔在 14 天内收集数据。文件内容如图: 在此处输入图像描述

如何将这些文件合并为一个以便进一步使用它们?

машинное-обучение
  • 1 个回答
  • 10 Views

Sidebar

Stats

  • 问题 10021
  • Answers 30001
  • 最佳答案 8000
  • 用户 6900
  • 常问
  • 回答
  • Marko Smith

    我看不懂措辞

    • 1 个回答
  • Marko Smith

    请求的模块“del”不提供名为“default”的导出

    • 3 个回答
  • Marko Smith

    "!+tab" 在 HTML 的 vs 代码中不起作用

    • 5 个回答
  • Marko Smith

    我正在尝试解决“猜词”的问题。Python

    • 2 个回答
  • Marko Smith

    可以使用哪些命令将当前指针移动到指定的提交而不更改工作目录中的文件?

    • 1 个回答
  • Marko Smith

    Python解析野莓

    • 1 个回答
  • Marko Smith

    问题:“警告:检查最新版本的 pip 时出错。”

    • 2 个回答
  • Marko Smith

    帮助编写一个用值填充变量的循环。解决这个问题

    • 2 个回答
  • Marko Smith

    尽管依赖数组为空,但在渲染上调用了 2 次 useEffect

    • 2 个回答
  • Marko Smith

    数据不通过 Telegram.WebApp.sendData 发送

    • 1 个回答
  • Martin Hope
    Alexandr_TT 2020年新年大赛! 2020-12-20 18:20:21 +0000 UTC
  • Martin Hope
    Alexandr_TT 圣诞树动画 2020-12-23 00:38:08 +0000 UTC
  • Martin Hope
    Air 究竟是什么标识了网站访问者? 2020-11-03 15:49:20 +0000 UTC
  • Martin Hope
    Qwertiy 号码显示 9223372036854775807 2020-07-11 18:16:49 +0000 UTC
  • Martin Hope
    user216109 如何为黑客设下陷阱,或充分击退攻击? 2020-05-10 02:22:52 +0000 UTC
  • Martin Hope
    Qwertiy 并变成3个无穷大 2020-11-06 07:15:57 +0000 UTC
  • Martin Hope
    koks_rs 什么是样板代码? 2020-10-27 15:43:19 +0000 UTC
  • Martin Hope
    Sirop4ik 向 git 提交发布的正确方法是什么? 2020-10-05 00:02:00 +0000 UTC
  • Martin Hope
    faoxis 为什么在这么多示例中函数都称为 foo? 2020-08-15 04:42:49 +0000 UTC
  • Martin Hope
    Pavel Mayorov 如何从事件或回调函数中返回值?或者至少等他们完成。 2020-08-11 16:49:28 +0000 UTC

热门标签

javascript python java php c# c++ html android jquery mysql

Explore

  • 主页
  • 问题
    • 热门问题
    • 最新问题
  • 标签
  • 帮助

Footer

RError.com

关于我们

  • 关于我们
  • 联系我们

Legal Stuff

  • Privacy Policy

帮助

© 2023 RError.com All Rights Reserve   沪ICP备12040472号-5