Владимир Рафалович - Data mining, или Интеллектуальный анализ данных для занятых. Практический курс. Страница 3

Что нужно для работы

1. Вам необходимо разумеется иметь Excel 2007 или более позднее издание (2010 или 2013). В этой книге, однако, мы будем использовать Excel 2010 и все примеры будут иллюстрироваться из него. Excel обычно является частью Microsoft Office 2007, 2010 или 2013. Excel должен быть установлен на том компьютере, на котором вы работаете.

2. Нужно иметь стандартное или Enterprise издание SQL-сервера 2005, 2008 или более позднее. SQL-сервер не обязательно должен находиться на том компьютере на котором вы непосредственно работаете, но с ним должна быть хотя бы интернет-связь, поскольку вся обработка данных происходит именно на SQL-сервере. Кроме того, на самом SQL-сервере должна быть установлена компонента SQL Analysis Service (SSAS). Этот продукт хотя и является частью SQL-сервера, не устанавливается по умолчанию и должен быть установлен дополнительно. Это именно тот сервис SQL-сервера, где находятся все алгоритмы и где будет происходить расчет моделей и обработка данных.

3. Для Excel необходимо также иметь Data Mining Add-in. Это бесплатная подпрограмма-надстройка, которая естественным образом внедряется в Excel после установки и нужна для коммуникаций между Excel и SQL-сервером. К тому же она добавляет в Excel дополнительную линейку меню, необходимую для интеллектуальной разработки данных, выбора инструментов и манипулированния данными. Как устанавливается и откуда берется эта важная подпрограмма рассматривается в главе 1.

Глава 1

Установка подпрограммы-надстройки

Прежде, чем использовать Excel для разработки данных, необходимо провести установку подпрограммы Data Mining Add-in. Хотя она бесплатна, но она не устанавливается по умолчанию при первой установке Excel на компьютере. Сначала Add-In надо загрузить. Проще всего рекомендуем произвести в Google следующий поиск «sql server 2008 data mining add-ins». Результат поиска приведет вас на страницу компании Microsoft (Рис. 1–1). В самом низу страницы находится собственно линк на скачивание Add-in. Еще раз напомним, что если вы пользуетесь Excel версии 2013 года, то установка этой подпрограммы не нужна. Она уже является неотъемлемой частью Excel! Речь идет только об Excel версиях 2007 или 2010. Для загрузки можно воспользоваться также сайтом http://www.sqlserverdatamining.com

Рис. 1–1. Страница загрузки подпрограммы Data mining Add-In

Рис. 1–2. Первый шаг мастера установки надстройки.

Рис. 1–3. Выбор необходимой опции: "Клиент интеллектуального анализа данных".

После загрузки подпрограммы-надстройки традиционно откроется мастер ее установки. После принятия условий использования программы (Рис. 1–2) будет предложено ввести ваше имя, а затем откроется окно опций установки (Рис. 1–3).

Далее можно нажать на кнопку «Далее». Однако, хотим обратить ваше внимание на опцию «Клиент интеллектуального анализа данных для Excel», которая по умолчанию не отмечена! Если ее выбрать и продолжить установку, то Excel будет иметь дополнительное меню: Data Mining. Опции под этим меню будут в принципе аналогичны тем, которые существуют в интересующем нас в этой книге анализе таблиц, но рассчитаны на более продвинутых пользователей, которые могут по своему усмотрению выбирать алгоритмы и модели для расчетов. Разница в меню представлена на Рис. 1–4 и 1–5.

Рис. 1–4. Меню Excel, когда опция «Клиент интеллектуального анализа данных для Excel» не выбрана.

Рис. 1–5. Меню Excel, когда опция «Клиент интеллектуального анализа данных для Excel» выбрана. Видно дополнительное меню Data Mining для продвинутых пользователей.

Выбирайте эту опцию, или нет, по своему усмотрению и переходите к окончанию установки. Теперь сам Add-in установлен. Но это еще не все. Надо соединить его с SQL-сервером и провести конфигурацию последнего.

Подсоединение надстройки к SQL-серверу

Когда вы откроете Excel в первый раз после установки надстройки, скорее всего, возникнет новый мастер подсоединения Excel к SQL-серверу. Excel должен будет инициировать подпрограмму Data Mining Add-in и проведет вас через мастер его конфигурации. Дело в том, что для работы этого Add-in мало иметь Excel; поскольку сама обработка данных происходит на SQL-сервере, то необходимо иметь подключение к нему. Поэтому мастер предложит вам установить пробную версию SQL-сервера или, если SQL-сервер уже установлен, надо будет отметить опцию использования существующего Анализа Данных на SQL-сервере. При этом, в реальности, имеется две, а не одна опции, в зависимости от того, являетесь ли вы администратором на установленном SQL-сервере или нет.

При переходе на следующий экран мастера надо будет щелкнуть по линку внизу окна. Дело в том, что необходимо произвести конфигурацию системы Анализа Данных самого SQL-сервера, что бы он мог успешно взаимодействовать с Data mining Add-in в Excel. При этом стартует Мастер конфигурации SQL-сервер 2008 Data mining Add-in.

На первом шаге необходимо ввести имя SQL-сервера. Обычно, это (local), но если ваш SQL-сервера не локален, то вводится его сетевое имя. На втором шаге надо отметить опцию позволяющую создание временных моделей.

Третий шаг попросит ввести название новой базы данных, которая будет создана и, собственно, будет взаимодействовать с надстройкой и где будут производиться все вычисления. Название базы данных, естественно, произвольно.

Конец ознакомительного фрагмента.