R: - больше, чем вся статистика в одном пакете

(http://www.R-project.org/)

-- 01 июля 2004 года--

Итак, что такое R? "R - система для статистических вычислений и графики. Она состоит из языка R и окружения (R run-time environment) с графикой, отладчиком, буфером прошлых команд и возможностью исполнения скриптов" (цитата из пространного документа "The R FAQ" `http://www.ci.tuwien.ac.at/~hornik/R/',  ISBN 3-900051-01-1).

Но вначале был не R, а S, разработка AT&T Bell Laboratories. Дизайн S и другого известного стат.пакета Scheme был взят за основу созданного в начале 90-ых свободного GPL- приложения R, получившего название по первой букве имен двух энергичных сотрудников университета в Окленде, Новая Зеландия, Роберта Джентльмена и Росса Ихаки. В 1997 году сформировалась команда примерно из 20 разработчиков ("The R Core team"), включая, среди прочих, и главного творца пакета S Джона Чемберса. Неудивительно, что, как не без иронии отмечено в авторском файле README, язык R "не совсем непохож на язык S", - скажем мы, они почти в точности совпадают. Правильнее вопрос о разнице между S и R звучит как "Что не может пакет S, из того что может R?", и ответ авторов таков - "В принципе вы сможете перенести в S всё недостающее из R сами".

Говоря об R, стоит упомянуть об S-PLUS - предлагаемом реселлером Insightful Corporation варианте S. Лицензия - главное отличие между этими пакетами

Как обычно, у пользователя есть выбор между своей собственной компиляцией исходного кода и бинарными файлами. Существуют скомпилированные пакеты 
R для Unix, Windows и Macintosh. Подробная документация ( 800+ страниц Reference Index - описания и примеров функций, а также "R for Windows FAQ","R for Macintosh FAQ/DOC") в ряде форматов, в т.ч. HTML и PDF. Конечно же, их приходится читать по-английски, хотя на наш взгляд для людей, имеющих представление о статистике Колмогорова-Смирнова, Ansari-Bradley или Kruskal-Wallis, знание английского языка является обычным.

В состав дистрибутива
R входят стандартные стат. функции, анализ временных рядов и регрессионный анализ, стат. моделирование, различные тесты, - словом, всё, чего ждешь от большого стат. пакета. Примеры наборов данных можно найти здесь же с подробными объяснениями и синтаксисом функций. Те, у кого возникнет желание, могут посмотреть в Интернете архив CRAN (Comprehensive R Archive Network). Здесь связь R с Oracle, MySQL, ODBC, ArcInfo, GRASS, всевозможные коллекции статистических данных, включая, например, те, что использованы авторами классического учебника "Regression Analysis, Theory, Methods and Applications", а также функции обмена данными (т.е. чтения и записи) с другими известными статитическими пакетами: Minitab, SAS, SPSS, Stata, и др. Кроме того, есть Web-интерфейсы, Java и CGI-скрипты.

А.Шевляков  alex@motivation.ru

Copyright © ООО 'Мотивация', 2004. Все права защищены.