В этой книге представлены концепции и методы обработки собранных данных или информации, которые будут использоваться в различных приложениях. В частности, в ней рассказывается о добыче данных и инструментах, используемых для обнаружения знаний из собранных данных. Эта книга называется открытием знаний из данных (KDD). Она посвящена целесообразности, полезности, эффективности и масштабируемости методов работы с большими массивами данных. После описания добычи данных в этом издании рассказывается о методах познания, предварительной обработки, обработки и хранения данных. Далее представлена информация о хранилищах данных, онлайновой аналитической обработке (OLAP) и технологии кубов данных. Затем описываются методы поиска частых закономерностей, ассоциаций и корреляций для больших массивов данных.