Итак, что такое R? "R - система для статистических вычислений
и графики. Она состоит из языкаR и окружения (R
run-time environment) с графикой, отладчиком, буфером прошлых команд и возможностью
исполнения скриптов" (цитата из пространного документа "The R FAQ" `http://www.ci.tuwien.ac.at/~hornik/R/',
ISBN 3-900051-01-1).
Но вначале был не R, а S, разработка AT&T Bell Laboratories.
Дизайн S и другого известного стат.пакета Scheme был взят за
основу созданного в начале 90-ых свободного GPL- приложения R, получившего
название по первой букве имен двух энергичных сотрудников университета в Окленде,
Новая Зеландия, Роберта Джентльмена и Росса Ихаки. В 1997 году сформировалась
команда примерно из 20 разработчиков ("The R Core team"), включая, среди
прочих, и главного творца пакета S Джона Чемберса. Неудивительно,
что, как не без иронии отмечено в авторском файле README, язык R "не
совсем непохож на язык S", - скажем мы, они почти в точности совпадают.
Правильнее вопрос о разнице между S и R звучит как "Что не
может пакет S, из того что может R?", и ответ авторов таков
- "В принципе вы сможете перенести в S всё недостающее из R
сами".
Говоря об R, стоит упомянуть об S-PLUS - предлагаемом реселлером
Insightful Corporation варианте S. Лицензия - главное отличие между
этими пакетами
Как обычно, у пользователя есть выбор между своей собственной компиляцией
исходного кода и бинарными файлами. Существуют скомпилированные пакеты R для Unix, Windows
и Macintosh. Подробная документация ( 800+ страниц Reference Index - описания
и примеров функций, а также "R for Windows FAQ","R for Macintosh FAQ/DOC")
в ряде форматов, в т.ч. HTML и PDF. Конечно же, их приходится читать по-английски,
хотя на наш взгляд для людей, имеющих представление о статистике Колмогорова-Смирнова,
Ansari-Bradley или Kruskal-Wallis, знание английского языка является обычным.
В состав дистрибутива R входят стандартные
стат. функции, анализ временных рядов и регрессионный анализ, стат. моделирование,
различные тесты, - словом, всё, чего ждешь от большого стат. пакета. Примеры
наборов данных можно найти здесь же с подробными объяснениями и синтаксисом
функций. Те, у кого возникнет желание, могут посмотреть в Интернете архив
CRAN (Comprehensive R Archive Network).
Здесь связь R с Oracle, MySQL, ODBC, ArcInfo, GRASS, всевозможные
коллекции статистических данных, включая, например, те, что использованы
авторами классического учебника "Regression Analysis, Theory, Methods and
Applications", а также функции обмена данными (т.е. чтения и записи) с другими
известными статитическими пакетами: Minitab, SAS, SPSS, Stata, и др. Кроме
того, есть Web-интерфейсы, Java и CGI-скрипты.