DataMining

  • 19 окт. 2012 г.
  • 3658 Слова
Доклад
на тему: «Data Mining»

Выполнил:

Оглавление
Глава 1. Введение. 3
Глава 2. Data Mining. 4
1. Преимущества Data Mining. 4
2. Типы закономерностей 5
3. Классы систем Data Mining 6
3.1. Предметно-ориентированные аналитические системы 6
3.2. Статистические пакеты 6
3.3. Нейронные сети 7
3.4. Системы рассуждений на основе аналогичных случаев 8
3.5. Деревьярешений (decision trees) 8
3.6. Эволюционное программирование 9
3.7. Генетические алгоритмы 10
3.8. Алгоритмы ограниченного перебора 11
3.9. Системы для визуализации многомерных данных 12
4. Мнение экспертов о Data Mining …………………..…………………..…...….12
5. Перспективы технологии Data Mining………………..…………..…………….14
Глава 3. Заключение. 16
Библиографический список. 17

Глава 1. Введение.Развитие методов записи и хранения данных привело к бурному росту объемов собираемой и анализируемой информации. Объемы данных настолько внушительны, что человеку просто не по силам проанализировать их самостоятельно, хотя необходимость проведения такого анализа вполне очевидна, ведь в этих "сырых" данных заключены знания, которые могут быть использованы при принятии решений. Для того чтобыпровести автоматический анализ данных, используется Data Mining.
Data Mining – это процесс обнаружения в "сырых" данных ранее неизвестных нетривиальных практически полезных и доступных интерпретации знаний, необходимых для принятия решений в различных сферах человеческой деятельности. Изначально Data Mining использовался для решения задач медицины, биологии, космоса; сегодня эта наука получила широкоераспространение и может применяться в любой области, например, экономике, техническом анализе и др. Практически любая информация может быть предметом Data Mining. Data Mining является одним из шагов Knowledge Discovery in Databaces. Поэтому изучение Data Mining имеет высокое научное и практическое значение.
Цель работы: изучить понятие Data Mining, понять основные особенности ее использования.Задачи работы: ознакомится с преимуществами, типами закономерностей, классами систем Data Mining, проанализировать мнения экспертов и перспективы развития этой технологии.

Глава 2. Data Mining.
1. Преимущества Data Mining.
В связи с совершенствованием технологий записи и хранения данных на людей обрушились колоссальные потоки информационной руды в самых различных областях. Деятельность любогопредприятия (коммерческого, производственного, медицинского, научного и т.д.) теперь сопровождается регистрацией и записью всех подробностей его деятельности. Что делать с этой информацией? Стало ясно, что без продуктивной переработки потоки сырых данных образуют никому не нужную свалку.
Специфика современных требований к такой переработке следующие:
* Данные имеют неограниченный объем
* Данныеявляются разнородными (количественными, качественными, текстовыми)
* Результаты должны быть конкретны и понятны
* Инструменты для обработки сырых данных должны быть просты в использовании
Традиционная математическая статистика, долгое время претендовавшая на роль основного инструмента анализа данных, откровенно спасовала перед лицом возникших проблем. Главная причина - концепция усреднения повыборке, приводящая к операциям над фиктивными величинами (типа средней температуры пациентов по больнице, средней высоты дома на улице, состоящей из дворцов и лачуг и т.п.). Методы математической статистики оказались полезными главным образом для проверки заранее сформулированных гипотез (verification-driven data mining) и для "грубого" разведочного анализа, составляющего основу оперативной аналитическойобработки данных (online analytical processing, OLAP)
В основу современной технологии Data Mining (discovery-driven data mining) положена концепция шаблонов (паттернов), отражающих фрагменты многоаспектных взаимоотношений в данных. Эти шаблоны представляют собой закономерности, свойственные подвыборкам данных, которые могут быть компактно выражены в понятной...
tracking img