kika

Имхо, довольно распространенная задача. Скажем у нас есть множество структур, описывающих некую жызненную ситуацию, скажем мониторинг хостов в сети. Структура содержит имя хоста, адрес, всякие прочие фактически иммутабельные параметры плюс некое количество изменяющихся параметров мониторинга, время пинга, скорость передачи данных, количество HTTP ошибок и теде и тепе. Структуры хранятся, допустим для простоты, в хеше по имени хоста. Все отлично, софтина работает, обмеряет хосты, апдейтит табличку с записями и жизнь прекрасна. Теперь нам надо сделать запросы снаружи - типа а покажи-ка мне список хостов, отсортированных по пингу. Допустим, хостов у нас ровно один газиллион, поэтому сортировать на каждый запрос накладно.
В традиционной культуре мы строим сбалансированные деревья с указателями на структуры (а в структурах указатели на деревья) и организуем синхронное плавание.
А как в функциональной культуре решается такая задача? Pointer trickery тут какбе немного недоступна.

Вкратце: есть структура -record(host, {host_id, speed = 0}). и из нее ETS таблица из одного газиллиона записей. Надо быстро отдавать список хостов, отсортированный по speed. Можно наверное положить это в Мнезию и понадеяться на ее ORDER BY, а если без Мнезии, ручками?

S	M	T	W	T	F	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30	31

Most Popular Tags

admin - 2 uses
agily - 6 uses
auto - 4 uses
book - 3 uses
bydlo - 53 uses
c++ - 3 uses
cars - 4 uses
crime - 3 uses
email - 3 uses
erlang - 4 uses
food - 9 uses
fp - 11 uses
gadget - 20 uses
gadgets - 5 uses
geeky - 25 uses
google - 5 uses
hardware - 7 uses
hate - 42 uses
house - 3 uses
internet - 3 uses
iphone - 4 uses
it - 9 uses
job - 3 uses
joboffer - 14 uses
jobs - 3 uses
keno - 31 uses
kneelup - 25 uses
lame - 21 uses
life - 82 uses
mac - 5 uses
money - 10 uses
music - 3 uses
os - 3 uses
photo - 6 uses
politics - 45 uses
repost - 3 uses
school - 10 uses
science - 5 uses
sd - 83 uses
security - 3 uses
sovok - 10 uses
startup - 34 uses
tools - 3 uses
travel - 3 uses
usa - 10 uses
ussr - 5 uses
via ljapp - 2 uses
windows - 2 uses
бухло - 5 uses
кровавая гебня - 5 uses

Flat | Top-Level Comments Only

From:

kika.livejournal.com

Да, реально задача отдать topN, где N произвольное, но заранее заданное число. С "нормальной базой" есть одна проблема - на нее нет вычислительного ресурса. Предмет обсуждения - это телеком appliance, живущий в 2U корпусе и чисто конкретно нагруженный своей работой, за которую ему денег платят. Если с процессором там более-менее (пока) свободно, то с памятью полный швах, хотя технически ее от 12Гб в entry level.

109.livejournal.com

define "полный швах" :)

вообще, sql server (нормальный, а не компакт) может нормально жить в довольно-таки тесных помещениях - например, 100 мегабайт памяти на всё про всё. зависит от задачи, конечно. rule of thumb is - если all non-leaf index pages влезают в память, то всё в порядке. сравни с самописным решением: в памяти надо держать индексы целиком, а не только их non-leaf части.

также: обязательно ли сервер базы должен бежать на том же самом ящике? round trip через один хоп - это тоже sub-millisecond.

второй ящик - это минимум 2000 долларов на железо, плюс support costs. А полный швах - это буквально, вся доступная память занята приложением, которое готово съесть сколько дадуд. Плюс еще есть проблема с диском - дисковая подсистема заметно busy трафиком от приложения, часто iowait в районе 40-60%. В общем плохо там будет любому сиквелу, кроме разве что sqlite :-)

а чем sqlite такой волшебный?

вообще, конечно, если доступаться до базы должен только один процесс с одной машины, то embedded engines лучше.

скулайт очень маленький и для своих размеров достаточно быстр, если не требовать от него слишком многого.
Один процесс, да.

Purely functional data something

Purely functional data something

no subject

no subject

no subject

no subject

no subject

Profile

January 2017

Most Popular Tags

Page Summary

Style Credit

Expand Cut Tags