MapReduce и параллельные СУБД

MapReduce и параллельные СУБД

Возможные приложения
ETL и наборы данных, читаемые только единожды
Сложная аналитика
Полуструктурированные данные
Анализ на "скорую руку" (quick-and-dirty)

Производственная эксплуатация при ограниченном бюджете
Мощные инструментальные средства
"Лакомые кусочки" для СУБД
Исходная MR-задача Grep
Задача обработки Web-журналов
Задача соединения
Архитектурные различия
Повторяющийся разбор записей
Сжатие данных
Конвейеризация

Планирование
Поколоночное хранение данных
Обсуждение
Содержание раздела