MapReduce и параллельные СУБД

Сложная аналитика


Во многих приложениях интеллектуального анализа (data mining) и кластеризации данных программе приходится производить несколько проходов по данным. Такие приложения невозможно представить в виде одиночных агрегатных SQL-запросов. Вместо этого требуется сложная программа обработки потоков данных, в которой выходные данные одной части приложения являются входными данными другой его части. MR является хорошим кандидатом для реализации таких приложений.



Содержание раздела