Aprendizado de máquina no trading: teoria, prática, negociação e não só - página 3231

 
Forester #:
Por que você precisa dele? Quando estava fazendo experiências com o R, usei a dll-ku encomendada por SanSanych. Ela funciona bem e tem mais possibilidades, pois transfere qualquer dado nos dois sentidos, não apenas aspas (como era no primeiro port do R). Além disso, até consegui executar a otimização multithread por meio dela.

O suporte oficial, ao que me parece, pode dar um bom impulso para o R e o MKL ....

Novos artigos sobre todos os países, novas ideias, novas pessoas com quem conversar, novos algoritmos....

 

Há um site que registra a publicação de novos pacotes do R....

Sempre tive interesse em baixar esses dados e agregá-los por tempo (quantos pacotes novos são baixados por dia), bem para entender o que está acontecendo com a linguagem....

Mas sempre adiei, não sabia como fazer isso, achava que era longo e complicado....

Hoje decidi fazer isso, gastei cerca de 5 minutos para entender como fazer e 30 segundos no código em si)))

Aqui está o código

library(rvest)
library(xts)
url <- "https://cran.r-project.org/web/packages/available_packages_by_date.html"

tb <- url |> read_html() |> html_table() |> _[[1]] |> {\(.) .[nrow(.):1,]}()

tb$Date |> rle() |> _$lengths |> xts(as.POSIXct(r$values)) |> plot(main="количество новых пакетов",col=4)

download de dados do site + agregação por dia + visualização.


2008-09-08                                           1
2008-10-28                                           1
2010-06-25                                           1
2010-07-07                                           1
2011-08-18                                           1
2011-09-07                                           1
2011-12-01                                           1
2011-12-28                                           1
2012-01-28                                           1
2012-03-01                                           1
       ...                                            
2023-09-01                                          44
2023-09-02                                          35
2023-09-03                                          37
2023-09-04                                          32
2023-09-05                                          72
2023-09-06                                          84
2023-09-07                                          58
2023-09-08                                          45
2023-09-09                                          26
2023-09-10                                          27

Recebo uma média de 40-50 novos pacotes por dia.

=========================================================================


E aqui está o mesmo código no elogiado Python, que é o melhor para análise e em geral.

import pandas as pd
import requests
from bs4 import BeautifulSoup
import matplotlib.pyplot as plt

url = "https://cran.r-project.org/web/packages/available_packages_by_date.html"

response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
table = soup.find_all('table')[0] 
df = pd.read_html(str(table))[0]
df = df.iloc[::-1]

df['Date'] = pd.to_datetime(df['Date'])
df_grouped = df.groupby('Date').size()

df_grouped.plot(title="количество новых пакетов")
plt.show()

Date
2008-09-08     1
2008-10-28     1
2010-06-25     1
2010-07-07     1
2011-08-18     1
              ..
2023-09-06    84
2023-09-07    58
2023-09-08    45
2023-09-09    26
2023-09-10    29
Length: 2807, dtype: int64

===========================================================


7 linhas de código em R, 18 linhas de código em python...

 
Renat Fatkhullin #:

Essencialmente, tudo será feito à medida que definirmos os termos da competição - é um trabalho enorme.

Vamos aguardar as condições detalhadas.

No entanto, na maioria dos desenvolvimentos, as pessoas têm seus próprios desenvolvimentos, que não podem ser ajustados a padrões/modelos para todos. E as coisas mais valiosas não são os modelos, mas os preditores.

Se os preditores forem um conjunto fixo, a tarefa de treinamento se reduzirá à seleção dos mais significativos. Mas se for possível ajustar as configurações desses preditores, será mais divertido.

 
Andrey Dik #:

ZZY**. "the evening stops being languid" (a noite deixa de ser lânguida) - muito interessante o que acontecerá, afinal de contas você se importa, fxsaber, não é? - e eu também))))))))))))))))))))))))))

Provavelmente uma das coisas mais estúpidas é tentar mudar a opinião de outra pessoa. Nenhum argumento funciona. Daí a outra palavra "P" - bygones (passado).

 
fxsaber #:

Provavelmente, uma das coisas mais estúpidas é tentar mudar a opinião de outra pessoa. Nenhum argumento funciona. É por isso que a outra palavra com "P" é passado.

sua disputa == seus termos.

Isso é uma coisa boba de se discutir.

 

Terei que aumentar a quantidade de esforço para poder instalar pacotes com aceleração

import requests, pandas as pd, matplotlib.pyplot as plt
from bs4 import BeautifulSoup

df = pd.read_html(requests.get("https://cran.r-project.org/web/packages/available_packages_by_date.html").text, flavor='bs4')[0].iloc[::-1]
df.groupby('Date').size().plot(title="количество новых пакетов")
plt.show()
Mais uma vez, você foi sugado, apenas espalhou linhas pela tela e passou isso como verdade.
 
Maxim Dmitrievsky #:

Terei que aumentar a quantidade de esforço para poder instalar pacotes em um ritmo acelerado

Mais uma vez, estou ferrado, apenas espalhei as linhas na tela e passei como verdade.
Se eu compactá-lo de forma inútil como você fez, terei 2 linhas junto com a declaração da biblioteca....

Portanto, você também está sem sorte aqui.
 
mytarmailS #:
Se eu compactar de uma forma não utilizável como você fez, terei 2 linhas no total, juntamente com a declaração da biblioteca...

Portanto, você está sem sorte aqui também.

Uma forma absolutamente utilizável e uma sintaxe perfeitamente compreensível, e você aprende o alfabeto do predador para escrever código em curvas, que nem sequer estão no teclado)).

Como resultado, você não consegue nem mesmo escrever um loop sem erros em outros idiomas, porque está acostumado com hieróglifos.

 

A organização do campeonato com o objetivo de popularizar o MoD é muito bem-vinda.

É o que parece.

No entanto, a estrutura técnica do campeonato, que é python e onnx, deixa de fora do campeonato a verdadeira diversidade de modelos disponíveis no MO.

Centenas de modelos são deixados de fora. São esses modelos que definem o significado da palavra "aprendizado de máquina", e as várias redes neurais são uma parte pequena e não a mais interessante do MO para negociação.

Anexo uma lista bastante antiga (2015) de modelos disponíveis no shell caret, ou seja, disponíveis no operador de trem. A composição de alguns grupos de modelos não é divulgada, pois a lista reflete meus gostos.

Arquivos anexados:
 
É uma barreira contra um culto de loucos.