Страницы: 1
RSS
Выбор инструментов для расчета данных.
 
Здравствуйте. Вопрос теоретический:
Какие инструменты лучше использовать?
1. На данный момент изначально данные поступают в текстовом виде (csv)(около 60 гб в месяц), так же есть возможность импортировать их напрямую в бд mysql.
2. В отдельном excel файле происходит фильтрация данных путем запросов PQ каждые 3 часа, что бы влезть в 1 млн. строк. соответственно в ежедневном файле по 8 листов данных.
3. Далее  в следующем excel файле каждые 3 часа путем запросов PQ происходит сравнение строк данных на предмет изменения цены, а также расчет величины изменения.
4. В следующем файле данные за день объеденяются и перепроверяются.
В итоге есть структура папок с excel и csv (исходные данные)  структурированные по датам.
В конечном итоге Выбирается товар из отдельной структуры и по ID выискиваются все данные по изменениям цены за последние 15 дней.
На данный момент все работает, медленно и уверенно (хотя есть предчувствие что через одно место). Но возникают идеи о расширении количества пользователей данных (на данный момент использование только локально). И есть идея о переходе от структуры по датам в структуру по ID в виду очень долгого поиска.
1. Есть ли смысл переходить в формат БД? (Например Mysql, знания на уровне установки  CMS на хостинг и небольшие изменения структуры БД)
2. Какие варианты есть для обработки (расчетов, групировки) данных. Какой софт для этого можно использовать? Стоит изучить какие либо языки программирования? Возможно ли производить расчеты аналогичные запросам  PQ  путем sql-запросов?
3. Это не извращение хранить данные в бд, импортировать в excel обрабатывать с помощью запросов pq и экспортировать обратно?

Заранее благодарен.
 
 
Цитата
kolyaya написал:
Какие инструменты лучше использовать?
СУБД. Учитывая будущее подключение пользователей.
Заливаете данные в базу, обрабатываете там же, храните там же, выводите только результат. Ответ на ваш последний вопрос - извращение.

Цитата
kolyaya написал:
Стоит изучить какие либо языки программирования?
SQL синтаксис для работы с вашей СУБД.
 
kolyaya, На самом деле я не работаю плотно с обработкой данных, но это все крутится или рядом или непосредственно при моем участии, это ответ на часть письма в личке, а по существу вопроса, ответа конкретного тут не дать ибо архитектуру надо строить исходя из того какие данные , в каком объеме хранятся, скорость хранилища и скорость сетевого подключения, как самого сервера баз данных, так и клиентов.  И вот на этом строится решение. Может вам необходимо OLAP сервер добавлять, который возьмет на себя часть работ по трансформации.
По вопросам из тем форума, личку не читаю.
 
Цитата
БМВ написал:
ответ на часть письма в личке
похоже это была массовая спам-рассылка, ну и да, по сути
Цитата
БМВ написал:
ответа конкретного тут не дать
Соблюдение правил форума не освобождает от модераторского произвола
 
Цитата
buchlotnik написал:
похоже это была массовая спам-рассылка
Ну что же вы так сразу - массовая. Только избранным 5 пользователям написал, которые чаще помогали и на мой взгляд более квалифицированные. Просто не у кого совета попросить ((
 
Тоже напишу.
Если бы на работе руководство дало бы подобную задачу, я бы не стал отнекиваться типа с такими объемами данных не работают в Excel и вообще ко мне обращайтесь только по вопросам в Excel. Сказал бы - попробую настроить. Сразу скажу что знания с серверами и с запросами в sql так себе, но, судя по описанию задачи, задача не такая и сложная.
Настораживает это:
Цитата
kolyaya написал:
около 60 гб в месяц
Но насколько понимаю плюсовать(60гб*12) каждый месяц к имеющемуся не надо, просто каждый месяц новые данные и работать только с новыми данными.
Еще у вас есть :
Цитата
kolyaya написал:
есть возможность импортировать их напрямую в бд mysql
Так импортируйте, только тут же пишите:
Цитата
kolyaya написал:
Например Mysql, знания на уровне установки  CMS на хостинг и небольшие изменения структуры БД) .. Какой софт для этого можно использовать?
Куда вы собираетесь импортировать их напрямую в бд mysql ? На сайт что ли? Может так тоже можно, я еще не пробовал подключаться к данным mysql сайтов.
Или у вас есть сервер на компьютере?
Я бы  установил, если не MS  Sql(имеется русский язык), то Воркбенч и туда бы загнал бы эти 60гб. Не знаю как это все залетит( у меня еще не было необходимости использовать более 3 000 000 строк).
Когда все данные окажутся на сервере в базе, то остается только извлекать нужное:
Цитата
kolyaya написал:
Выбирается товар из отдельной структуры
а это, раз знаний в sql мало, уже можно в PQ делать
Цитата
kolyaya написал:
и по ID выискиваются все данные по изменениям цены за последние 15 дней.
Хотя можно, насколько понимаю, тем же запросом sql сделать
 
Цитата
Михаил Л написал:
Настораживает это: около 60 гб в месяц
Пока после отсеивания ненужных данных из этого массива остается нужных около 500 мб, все остальное уходит в архив. В архиве занимает 2-3 гб и ждет своего времени (вдруг понадобиться перепроверить что-то или достать что-то новое).
Цитата
Михаил Л написал:
есть возможность импортировать их напрямую в бд mysql
Так импортируйте, только тут же пишите:
В программе по сбору данных есть возможность прямого импорта в MySql. Сам MySql сервер есть на хостинге веб сайта. Так же сейчас запустил локальный для тестов.
Цитата
Михаил Л написал:
а это, раз знаний в sql мало, уже можно в PQ делать
Прослушал сегодня несколько курсов по MySql в youtube. Похоже что все задачи которые выполняет (в моих запросах) PQ можно реализовать на MySql. Буду пробовать.

Всем откликнувшимся спасибо. Буду рад услышать еще дополнительную критику и напутствия.  ;)  
 
Цитата
Только избранным 5 пользователям написал
Одно дело, когда в теме помогают по своему усмотрению, и совсем другое, когда Вы дергаете людей в личке и отнимаете личное время. Да, Вам надо, но надо ли это другим?
Прочитайте подпись БМВ...

Подумайте над этим.
Страницы: 1
Наверх