交易中的机器学习:理论、模型、实践和算法交易 - 页 3231

 
Forester #:
为什么需要它?我在尝试使用 R 时,用的是 SanSanych 订购的 dll-ku。它运行得很好,而且有更多的可能性,因为它可以双向传输任何数据,而不仅仅是引号(在第一个 R 移植中)。此外,我甚至还通过它运行了多线程优化。

在我看来,官方支持可以很好地推动/宣传 R 和 MKL ....

关于所有国家的新文章、新想法、新对话者、新算法....

 

有一个网站 记录了新 R 软件包的发布情况....。

我一直有兴趣下载这些数据,并按时间汇总 (每天下载多少新软件包),以便了解语言的发展情况....。

但我一直拖着,我不知道该怎么做,我觉得它又长又复杂....。

今天我决定做了,我花了大约 5 分钟来了解如何做,30 秒来写代码。)

代码如下

library(rvest)
library(xts)
url <- "https://cran.r-project.org/web/packages/available_packages_by_date.html"

tb <- url |> read_html() |> html_table() |> _[[1]] |> {\(.) .[nrow(.):1,]}()

tb$Date |> rle() |> _$lengths |> xts(as.POSIXct(r$values)) |> plot(main="количество новых пакетов",col=4)

从网站下载数据 + 按天汇总 + 可视化。


2008-09-08                                           1
2008-10-28                                           1
2010-06-25                                           1
2010-07-07                                           1
2011-08-18                                           1
2011-09-07                                           1
2011-12-01                                           1
2011-12-28                                           1
2012-01-28                                           1
2012-03-01                                           1
       ...                                            
2023-09-01                                          44
2023-09-02                                          35
2023-09-03                                          37
2023-09-04                                          32
2023-09-05                                          72
2023-09-06                                          84
2023-09-07                                          58
2023-09-08                                          45
2023-09-09                                          26
2023-09-10                                          27

我平均每天获得 40-50 个新软件包。

=========================================================================


下面是用 Python 编写的相同代码,Python 是最适合解析数据的语言。

import pandas as pd
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt

url = "https://cran.r-project.org/web/packages/available_packages_by_date.html"

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find_all('table')[0] 
df = pd.read_html(str(table))[0]
df = df.iloc[::-1]

df['Date'] = pd.to_datetime(df['Date'])
df_grouped = df.groupby('Date').size()

df_grouped.plot(title="количество новых пакетов")
plt.show()

Date
2008-09-08     1
2008-10-28     1
2010-06-25     1
2010-07-07     1
2011-08-18     1
              ..
2023-09-06    84
2023-09-07    58
2023-09-08    45
2023-09-09    26
2023-09-10    29
Length: 2807, dtype: int64

===========================================================


R 语言 7 行代码,Python 语言 18 行代码...

 
Renat Fatkhullin #:

基本上,一切都将按照我们制定的竞赛条款进行--这是一项艰巨的工作。

我们将等待详细的条件。

不过,大多数开发人员都有自己的开发方案,不可能为每个人都制定标准/模板。最有价值的东西不是模型,而是预测器。

如果预测因子是一个固定的集合,那么训练的任务就会简化为选择重要的预测因子。但如果可以调整这些预测因子的设置,就会更有趣。

 
Andrey Dik #:

ZZY**。"夜晚不再慵懒"--很有意思,毕竟你很在乎,fxsaber,不是吗?- 我也是))))))))))))))))))))))))))

试图改变别人的想法可能是最愚蠢的事情之一。争论再多也没用。因此,还有一个 "P "字--过去。

 
fxsaber #:

试图改变他人的想法可能是最愚蠢的事情之一。争论再多也没用。这就是为什么另一个 "P "字是 "bygones"。

他们的比赛==他们的条件。

这样的争论太愚蠢了。

 

我必须加大努力,才能安装带有加速功能的软件包

import requests, pandas as pd, matplotlib.pyplot as plt
from bs4 import BeautifulSoup

df = pd.read_html(requests.get("https://cran.r-project.org/web/packages/available_packages_by_date.html").text, flavor='bs4')[0].iloc[::-1]
df.groupby('Date').size().plot(title="количество новых пакетов")
plt.show()
你又一次被骗了,只是在屏幕上涂抹了几行字,就当成真理了。
 
Maxim Dmitrievsky #:

我必须加大力度,才能加快安装软件包的速度

我又一次搞砸了,我只是在屏幕上涂抹了几行字,并把它当作真理。
如果我像你一样把它压缩得一无是处,那么我就会有两行连同库声明....

所以你在这里也不走运。
 
mytarmailS #:
如果我像您一样用一种无法使用的方式进行压缩,那么连同库声明一共会有两行......

所以你在这里也不走运。

绝对可用的方式和完美易懂的语法,而你却要学习 "捕食者 "的字母表,用曲线来写代码,而键盘上根本就没有))。

因此,你甚至无法用其他语言无错误地编写一个循环,因为你已经习惯了象形文字。

 

我们只能对以普及国防部为目的举办锦标赛表示欢迎。

看起来是这样。

然而,锦标赛的技术框架(即 python 和 onnx)却将 MO 内现有模型的真正多样性排除在锦标赛之外。

数以百计的模型被排除在外。 正是这些模型定义了 "机器学习 "一词的含义,而各种神经网络只是 MO 的一小部分,而且不是交易中最有趣的部分。

我附上一份比较旧的(2015 年)模型列表,其中包括 Caret 外壳中可用的模型,即列车运行器中可用的模型。 某些模型 的构成未披露,因为该列表反映了我的口味。

附加的文件:
 
它是抵御疯子邪教的屏障。