Индексный файл - создать - Общее обсуждение

--- 2014.08.15 19:22 #31

komposter:

Думал об этом. Интересовался мнением:

Какое будет ускорение по сравнению с чтением файла и какое замедление по сравнение с работой в памяти?

СУБД размещает свои таблицы в памяти по возможности.

но не в твоем случае, если у тебя конечно не 32 Гб ОЗУ

поэтому как раскинуть 20Г в 4Г это надо поломать голову над оптимизацией.

Если упростишь свою задачу, то лучше таки сделай обычный RAM диск в памяти. и не заморачивайся на СУБД.

Если не смогёшь, ну тогда дерзай по винту.

Какой комп выбрать для Преобразование bool к int [АРХИВ] Любой вопрос новичка,

Vasiliy Aseev 2014.08.16 06:13 #32

1)Рассмотри вариант с твердотельным диском. Шустрый диск на 100 гигов можно купить рублей за 5 а то и дешевле.

2)Вариант с БД https://www.mql5.com/ru/forum/35393/unread

3) вариант 1 + вариант 2, т.е. залить твои данные в БД, а БД свою очередь расположить на твердотельном диске.

Думаю последний вариант тебя устроит полност. Если нет, то меняй операционку с подьзовательской на серверную.

Как ускорить оптимизацию (перебор) Миграция с С# на Нетбук в качестве резервного

[Удален] 2014.08.16 10:48 #33

Была статья здесь про передачу данных между МКЛ и, например, С#, можно все тяжелые операции вынести туда и читать файл по кусочкам, не занимая всю ОЗУ. Передача данных достаточно удобная и шустрая в виде структур.

Вопрос по разделению кода Прожорливость памяти ОЗУ MT5, Создаем торгового робота

Eugeniy Lugovoy 2014.08.17 08:35 #34

komposter:

Какое будет ускорение по сравнению с чтением файла и какое замедление по сравнение с работой в памяти?

Ну, Вам ведь не просто читать нужно файл, а еще вести поиск, вычисления, конвертировать текст в числа, выполнять сортировку и т.п.

Во-первых, если данные не часто обновляются, то можно создать сколь угодно индексов по атрибутам, участвующим в поиске данных (в т.ч. и совокупности атрибутов). Таким образом, поиск будет производиться быстрее (при использовании индексов), следовательно и расчеты тоже.

Во-вторых, скажем MySQL, MS SQL, Oracle и другие СУБД используют технологию кеширования данных для повторяющихся запросов, это тоже дает некоторый плюс скорости обработки.

В-третьих, можно разбить таблицу на части (partitions), скажем по годам. При этом запросы, выбирающие данные по одному году не будут считывать/вести поиск по данным, находящимся в других партициях.

В-четвертых, поскольку исходные данные у Вас находятся в текстовом виде, то при загрузке в БД объем должен уменьшиться в связи с приведениям к естественным типам. Например, число 124.223456221 в текстовом виде займет 13 байт, в БД в зависимости от типа 4-8; дата и время "2014-08-17 10:23:35" - 19 байт, а в БД - 8 байт.

В-пятых, если используется часто агрегированная информация за определенные периоды, то можно эти данные агрегировать разово и хранить в другой таблице.

Конечно, если речь лишь о чтении данных в память, то WinApi выполнит это шустрее, но что с данными делать потом? Представьте, даже для поиска нужной части данных, необходимо все данные прочитать с диска. Или же самому писать функционал индексирования, сортировать данные в файле, создавать индексные фалы на все операции поиска, в общем переписывать половину функционала СУБД. Для обработки такого объема данных и желания разумной производительности, это необходимо.

Мое мнение однозначно - серверная СУБД (файловые БД типа MS Access, SQLite тут не подойдут) на выделенной машине. Будет достаточно разумная производительность и удобство обработки данных (SQL-запросы). Иначе убьете много времени на написание низкоуровневых "внутренностей" для обработки файла.

База данных SQLite Умная логика обработки информации Обсуждение статьи "Работа с

Yuriy Zaytsev 2014.08.18 08:44 #35

komposter:

Думал об этом. Интересовался мнением:

Какое будет ускорение по сравнению с чтением файла и какое замедление по сравнение с работой в памяти?

( имею опыт работы с базой более 3ТБ и относительно карликовыми базами 10-100гиг )

но при определенном железе ... скажем от 64ггб озу и выше с хорошей дисковой подсистемой

в этой ситуации в сравнении с работой с огромным файлом

ускорение на SQL будет существенное но скорость конечно будет зависеть от реализации на SQL

- правильная разработка базы - правильные индексы - правильная конфигурация базы

имеется ввиду разбитие файлов ( т о о чем пишет elugovoy верно )

Для полноценной реализации потребуется отдельный сервер , серверная операционка - база SQL

если MS SQL то не ниже 2008 ( по софту так же желательно не ниже 64 )

Но на мой взгляд реализация будет достаточно трудоемкая и затратная по железу... ( в идеале 64 бита )

--

если же на машине всего 16 гиг и при этом машина используется как станция

ставить на нее SQL сервер будет не сильно здорово - но лучше чем мучатся с текстовым файлом

правда если нет опыта работы с SQL некоторые потребуются усилия при реализации

Загрузка котировок в базу Исправлен ли баг тестирования Мы запускаем облачный сервис

Yuriy Zaytsev 2014.08.18 09:02 #36

barabashkakvn:

А если этот файл сжать архиватором, какой получится объём (ведь текст должен очень хорошо сжиматься)?

время на раз-архивацию при каждом проходе убьет производительность намертво

Vladimir Karputov 2014.08.18 09:22 #37

YuraZ:

время на раз-архивацию при каждом проходе убьет производительность намертво

Я не имел ввиду разархивацию. Если архивация может сильно сократить объём, значит имеет смысл сжимать информацию в индексный файл.

Yuriy Zaytsev 2014.08.18 10:27 #38

barabashkakvn:
Я не имел ввиду разархивацию. Если архивация может сильно сократить объём, значит имеет смысл сжимать информацию в индексный файл.

изначально было

barabashkakvn:
А если этот файл сжать архиватором, какой получится объём (ведь текст должен очень хорошо сжиматься)?

отсюда и была реакция на ваш пост!

индексный файл - создать... ?! это уже другая тема

еще вообще круче написать свой ( подобие SQL ) сервер - но зачем ?

Vladimir Karputov 2014.08.18 10:42 #39

YuraZ:

изначально было

отсюда и была реакция на ваш пост!

индексный файл - создать... ?! это уже другая тема

еще вообще круче написать свой ( подобие SQL ) сервер - но зачем ?

Изначально был вопрос к автору - а насколько сожмётся файл. Эт Вы уже батенька допридумывали про разархивацию.

Yuriy Zaytsev 2014.08.18 11:12 #40

barabashkakvn:
Изначально был вопрос к автору - а насколько сожмётся файл. ....

Можно вопрос , а зачем ?

ну сожмется допустим на 70-80% и что это даст ? автору в решении проблемы которую он описал

Need help! Не решается задача, упираюсь в ограничения железа - страница 4