神经网络和输入

Vladimir Perervenko 2014.02.02 07:33 #371

下午好。

不仅如此。我使用ada、randomForest（各种变体）、C50和其他。但最好的结果当然是来自CORElearn的ada和rfNear()。被高度赞扬的svm并没有显示出任何优势（除了它需要很长的时间来学习）。在不贬低其重要性的情况下，也许我不能正确地烹饪它？

工作的顺序如下。检查输入数据的重要性，确定每个模型的最佳参数。通过三种不同的模型进行计算，并进行校准，通过简单的投票决定。在初始样本为1000条的情况下，模型在250条的情况下稳定地工作，无需重新训练。准确度控制和估计。

有一些软件包可以估计预处理方法对结果的影响并选择最佳方法，此外还可以使用主成分方法对输入数据进行评估。我还没有掌握它们，因为我没有足够的时间。但我将继续研究它们。

好运。

Yury Reshetov 2015.01.05 04:43 #372

grell:

你认为哪些输入信号带有有用的信息？）

见附件档案中的PDF文件：P.17 减少不重要 的预测因素......。

里面有一个简单的例子，清楚地表明该方法只对训练样本中不是解释变量的输入进行了正确的降样。

附加的文件：

theory_of_generalization_ability.zip 173 kb

Mihail Marchukajtes 2015.01.08 07:22 #373

HMM...有意思，从书中的链接下载了这个项目，但不知道如何运行它。你能给我一个提示吗？

Mihail Marchukajtes 2015.01.08 07:40 #374

而当通过java打开。它说没有Jproject类....像这样....

Mihail Marchukajtes 2015.01.08 07:43 #375

这里有一个这样的窗口....

Yury Reshetov 2015.01.08 08:40 #376

nikelodeon:
HMM...有趣的是，我从书中的链接下载了这个项目，但如何运行它我不知道。你能告诉我吗？

有没有可能是你电脑上的Java版本已经过期？我在1.8.0_25版本下编译了这个项目

从以下网站下载最新版本的Java2SE（JRE或JDK）： http://java.com/ru/

Mihail Marchukajtes 2015.01.09 04:54 #377

很好，一切都在运行，但不清楚应该以什么形式提交数据....，很明显，.csv嘛，它们应该如何安排，等等。

如果你能给我发一个有例子的数据文件....

Yury Reshetov 2015.01.09 05:14 #378

nikelodeon:

很好，一切都开始运行了，但不清楚数据应该以什么形式....，很明显，.csv嘛，应该怎么安排，等等。

如果你能将数据文件与例子发送到....

附件中有一个CSV文件，有一个分类的例子。

简而言之。

单元的分隔符是分号。

数字的整数部分和小数部分的分隔符：点或逗号（所有逗号都自动替换为句号）。

第一栏--实例标识符（以文本形式）。

最后一栏--因变量的值：1--属于一个给定的类别，0--属于一个未定义的类别（除给定类别之外的任何类别）。

第一行--要素标识符（以文本形式）。

第二行--关于因素标识符的说明，例如，测量单位（作为文本）。

第二行下面、第一列右边和最后一列左边的剩余数据是因子的数值（非数值的不作处理）。

Mihail Marchukajtes 2015.01.09 16:12 #379

当然我的公式比较简单，而且我没有太多的数据，但我如何解释呢？我不明白 :-(.

Mihail Marchukajtes 2015.01.09 16:42 #380

我明白了。第一个转变是对输入数据进行归一化处理，归一化处理后，我将数据代入公式，得到的结果是什么？我的意思是，我把归一化的数据放入公式，然后根据公式得到指标的曲线？为什么要加一个>0的符号呢？

这有点不清楚 :-(

神经网络和输入 - 页 38