2017-02-09 4 views
0

Эта публикация:моделирование Procs для SAS на Hadoop

Pdf

упоминает, что SAS может работать только (MapReduce?) Некоторые модельные проки на Hadoop. Кто-нибудь знает эти PROC или даже лучше, есть ли исчерпывающий список? Благодарю.

Christian

ответ

1

Я не видел список процедур, которые будут работать с Hadoop, он также быстро изменяется из-за дополнения в программы SAS наряду с изменениями в Hadoop.

Существует SAS Поддержка Hadoop постранично SAS 9.4 Support for Hadoop | RESOURCES/THIRD-PARTY SOFTWARE REFERENCE

Есть много статей офф этой страницы, но ссылка на Hadoop Support Matrix полезно увидеть, что SAS Продукты поддержки Hadoop, включая распределение, версию, и любые известные проблемы.

Имеется несколько документов, но я думаю, что это около Data Modeling Considerations in Hadoop and Hive by Clark Bradley, Ralph Hollinshead, Scott Kraus, Jason Lefler, Roshan Taheri October 2013 может быть вам подходит.

SAS имеет множество продуктов, которые взаимодействуют со многими системами типа базы данных, включая Hadoop, и варианты растут вместе с Hadoop. Есть несколько новых продуктов, таких как SAS Data Loader для Hadoop (и других), которые поддерживают выполнение заданий с использованием Spark Engine вместо MapReduce. Также просто для выяснения большинства кластеров Hadoop запускается пряжа/mapreduce2, а не только Mapreduce 1. SAS может поддерживать Mapreduce, но в большинстве случаев кластеры используют пряжу/mapreduce2, которые SAS также поддерживает. Кроме того, некоторые программы SAS, работающие против Hadoop, могут иногда не требовать работы Mapreduce, в зависимости от того, что вы пытаетесь сделать.

Есть только несколько распространенных двигателей в Hadoop для использования честно. У вас есть старший Mapreduce (1), который намного старше. Затем появилась пряжа/mapreduce2 после того, что, вероятно, является наиболее распространенным механизмом выполнения на сегодняшний день. Spark Engine доступен в течение нескольких лет, но он все еще довольно новый, он должен быть быстрее, но не столь гибким, как Mapreduce2, из того, что я слышал. Я думаю, у Hortonworks есть движок под названием Apache Tez, который будет работать с SAS из моего опыта. Apache Tez по-прежнему использует пряжу, а вместо движка Mapreduce2 использует Apache Tez. Похоже, что ваш клиент SAS даже не знает разницы, и до сих пор у меня не возникало проблем с пряжей, работающей с Tez. Там может быть несколько небольших проектов, но это единственные, с которыми я сталкиваюсь.