Выбросы считаются зашумленными данными в статистике и оказались важной проблемой, которая изучается в различных областях исследований и прикладных областях. Многие методы обнаружения выбросов были разработаны специально для определенных областей применения, в то время как некоторые методы являются более общими. Некоторые прикладные области исследуются в условиях строгой конфиденциальности, например, исследования преступности и террористической деятельности. Анализ больших данных стал очень популярным в современном сценарии, и манипулирование большими данными привлекло пристальное внимание исследователей в области анализа данных. Облачные вычисления предоставляют мощные и экономичные инфраструктурные ресурсы для облачных пользователей, чтобы обрабатывать постоянно растущие большие данные с помощью таких механизмов обработки данных, как MapReduce. В данной работе рассматриваются два алгоритма кластеризации, известные как DBScan и K-Means, и реализованы на наборе данных Sensed корп